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内 容 提 要 


本 书 主要 介绍 Linux 命令 行 的 使 用 ， 循 序 渐进 ， 深 入 浅 出 ， 引 导读 者 全 面 
掌握 命令 行 的 使 用 方法 。 

本 书 分 为 四 部 分 。 第 一 部 分 开始 了 对 命令 行 基 本 语言 的 学 习 之 旅 ， 包 括 命 
令 结 构 、 文 件 系 统 的 导 引 、 命 令 行 的 编辑 以 及 关于 命令 的 帮助 系统 和 使 用 手册 。 
第 二 部 分 主要 讲述 配置 文件 的 编辑 ， 用 于 计算 机 操作 的 命令 行 控制 。 第 三 部 分 
讲述 了 从 命令 行 开始 执行 的 常规 任务 。 类 UNIX 操作 系统 ， 比 如 Linux， 包 含 了 
很 多 “经 典 的 ”命令 行程 序 ， 这 些 程序 可 以 高 效 地 对 数据 进行 操作 。 第 四 部 分 
介绍 了 shell 编程 ， 这 是 一 个 公认 的 初级 技术 ， 并 且 容 易学 习 ， 它 可 以 使 很 多 常 
见 的 系统 任务 自动 运行 。 通 过 学 习 shell 编程 ， 读 者 也 可 以 熟悉 其 他 编程 语言 的 
使 用 。 

本 书 适合 从 其 他 平台 过 渡 到 Linux 的 新 用 户 和 初级 Linux 服务 器 管理 员 阅 
读 。 没 有 任何 Linux 基础 和 Linux 编程 经 验 的 读者 ， 也 可 以 通过 本 书 掌 握 Linux 
命令 行 的 使 用 方法 。 
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我 想 给 大 家 讲 一 个 故事 。 故 事 内 容 不 是 Linus Torvalds 在 1991 年 怎样 编写 
了 Linux 内 核 的 第 一 个 版 本 ， 因 为 这 些 内 容 你 可 以 在 很 多 Linux 图 书 中 找到 。 我 
也 不 想 告诉 你 ， 更 早 之 前 ，Richard Stallman 是 如 何 开始 GNU 项 目 ， 设 计 了 一 
个 免费 的 类 UNIX 操作 系统 。 那 也 是 一 个 很 有 意义 的 故事 ， 但 大 多 数 Linux 图 
书 也 讲 到 了 它 。 我 想 给 大 家 讲 一 个 如 何 才能 夺回 计算 机 控制 权 的 故事 。 


在 20 世纪 70 年 代 后 期 ， 我 刚 开 始 和 计算 机 打交道 时 ， 正 在 进行 着 一 场 革 
命 ， 那 时 的 我 还 是 一 名 大 学 生 。 微 处 理 器 的 发 明 使 得 你 我 这 样 的 普通 人 真正 拥 
有 一 合计 算 机 成 为 可 能 。 今 天 ， 人 们 难以 想象 ， 只 有 大 公司 和 强大 的 政府 机 构 才 
能 够 使 用 计算 机 的 世界 ， 是 怎样 的 一 个 世界 。 让 我 说 ， 你 其 实 想 象 不 出 多 少 来 。 


如 今 ， 世 界 已 经 截然 不 同 。 计 算 机 遍布 各 个 领域 ， 从 小 手表 到 大 型 数据 中 
必 ， 以 及 介 于 它们 之 闻 的 每 一 样 东西 。 除 了 随处 可 见 的 计算 机 之 外 ， 我 们 还 有 
一 个 无 处 不 在 的 连接 所 有 计算 机 的 网 络 。 这 开创 了 一 个 奇妙 的 个 人 授权 和 创作 
自由 的 新 时 代 。 但 是 在 过 去 的 二 三 十 年 里 ， 一 些 事情 在 悄然 发 生 。 一 个 大 公司 
不 断 地 把 它 的 控制 权 强 加 到 世界 绝 大 多 数 的 计算 机 上 ， 并 且 决 定 你 对 计算 机 的 
操作 权力 。 幸 运 的 是 ， 世 界 各 地 的 人 们 正在 努力 进行 抗争 。 他 们 通过 自己 编写 
软件 来 争夺 自己 计算 机 的 控制 权 。 他 们 创造 了 Linux ! 

很 多 人 提 到 Linux 的 时 候 都 会 讲 到 “自由 ”， 但 是 并 不 是 所 有 人 都 明白 这 种 
自由 到 底 意 味 着 什么 。 自 由 就 是 能 够 决定 计算 机 可 以 做 什么 ， 而 获得 这 种 自由 
的 唯一 方法 就 是 知道 你 的 计算 机 正在 做 什么 ， 自 由 就 是 计算 机 没有 秘密 可 言 ， 


只 要 你 仔细 地 寻找 ， 就 能 了 解 其 全 部 内 容 。 


为 什么 使 用 命令 行 


读者 之 前 应 该 注意 到 ， 电 影 中 的 “超级 黑客 ” 就 是 那些 能 够 在 30 秒 内 入 
侵 到 超级 安全 的 军 方 计算 机 里 的 家 伙 ， 都 是 坐 在 计算 机 旁 ， 从 来 不 碰 鼠 标的 。 
这 是 因为 电影 制 片 人 意识 到 ， 我 们 人 类 从 本 能 上 会 明白 ， 能 够 让 计算 机 执行 任 
何 任务 的 唯一 途径 ， 是 通过 键盘 输入 命令 来 实现 的 。 


现在 ， 大 多 数 计算 机 用 户 只 熟悉 图 形 用 户 界面 (GUI)， 并 且 产 品 供应 商 和 
专家 还 在 不 停 地 灌输 一 种 思想 , 那 就 是 命令 行 界 面 (CLI) 是 一 种 很 糟糕 的 东西 ， 
而 且 已 经 过 时 。 这 是 很 不 幸 的 ， 因 为 一 个 好 的 命令 行 界面 是 一 种 很 神奇 的 人 机 
交互 方式 ， 就 和 我 们 采用 书信 进行 交流 一 样 。 据 说 “图 形 用 户 界面 能 让 简单 的 
任务 更 简单 ， 而 命令 行 界面 能 够 处 理 复杂 的 任务 ” 这 句 话 在 今天 看 来 仍然 是 正 
确 的 。 


由 于 Linux 系统 参照 了 UNIX 系列 操作 系统 ， 它 分 享 了 UNIX 系统 丰富 的 
命令 行 工具 。 UNIX 系统 在 20 世纪 80 年 代 早期 就 占据 了 主流 地 位 (尽管 它 只 是 
在 20 世纪 70 年 代 才 开发 出 来 )， 结 果 ， 在 普遍 采用 图 形 用 户 界面 之 前 ， 开 发 了 
一 种 广泛 使 用 的 命令 行 界面 。 事 实 上 ，Linux 开发 者 优先 使 用 命令 行 界面 (而 不 
是 其 他 系统 ， 比 如 Windows NT) 的 一 个 原因 就 是 因为 其 强大 的 命令 行 界面 ， 使 
“完成 复杂 的 任务 成 为 可 能 ”。 


本 书 内 容 


这 是 一 本 全 面 讲 述 如 何 使 用 Linux 命令 行 的 图 书 。 与 那些 仅 涉及 一 个 程序 
《比如 shell 程序 、bash) 的 图 书 不 同 ,本 书 从 更 广泛 的 意义 上 向 读者 传授 如 何 使 
用 命令 行 ， 它 是 如 何 工作 的 ， 它 有 哪些 功能 ， 以 及 使 用 它 的 最 佳 方式 是 什么 。 


这 不 是 一 本 关于 Linux 系统 管理 方面 的 图 书 。 任 何 一 个 关于 命令 行 的 重要 
讨论 ， 都 一 定 会 涉及 系统 管理 方面 的 内 容 ， 但 是 本 书 只 涉及 很 少 的 管理 方面 的 


问题 。 本 书 为 读者 准备 了 其 他 的 学 习 内 容 ， 帮 助 你 为 使 用 命令 行 打下 坚实 的 基 
础 ， 这 可 是 完成 一 个 系统 管理 任务 所 必需 的 至 关 重 要 的 工具 。 

本 书 以 Linux 为 中 心 。 其 他 许多 图 书 为 了 扩大 读者 群体 以 及 自身 的 影响 力 ， 
会 在 书 中 包含 其 他 平台 ， 比 如 通用 的 UNIX 和 Mac OS X 系统 。 而 且 为 了 达到 
这 个 目的 ， 它 们 只 能 “淡化 ” 书 的 内 容 ， 只 讲解 一 些 通用 的 主题 。 而 本 书 只 包 
括 当 前 的 Linux 发 行 版 本 。 尽 管 本 书 95% 的 内 容 对 其 他 类 UNIX 系统 用 户 也 有 
帮助 ， 但 是 本 书 主 要 还 是 面向 现代 的 Linux 命令 行 用 户 。 


本 书 读者 对 象 


本 书 适合 从 其 他 平台 转 到 Linux 的 新 用 户 阅 读 。 这 些 新 用 户 很 可 能 原来 是 
Microsoft Windows 版 本 的 超级 用 户 ， 也 可 能 是 老板 已 经 要 求 负责 管理 一 个 Linux 
服务 器 的 管理 员 ; 还 有 可 能 是 厌烦 了 桌面 系统 的 安全 问题 ， 想 要 体验 一 下 Linux 
系统 的 用 户 。 没 关系 ， 不 管 你 属于 哪 类 用 户 ， 都 欢迎 阅读 本 书 。 


不 过 一 般 来 说 ，Linux 的 启蒙 学 习 不 存在 任何 捷径 。 命 令 行 的 学 习 具 有 挑战 
性 而 且 颇 费 精 力 ， 这 倒 不 是 因为 它 太 难 ， 而 是 它 涵盖 的 内 容 太 多 。 一 般 的 Linux 
系统 有 上 于 个 程序 可 以 通过 命令 行使 用 ， 这 点 毫 不 夸张 。 你 需要 提醒 自己 的 是 ， 
命令 行 可 不 是 随便 就 能 学 会 的 。 


另 一 方面 ， 学 习 Linux 命令 行 也 非常 值得 。 如 果 你 认为 自己 已 经 是 一 名 “ 超 
级 用 户 ” 了 ， 那 么 请 注意 ， 你 可 能 不 知道 什么 才 是 真正 的 “超级 用 户 ”。 不 同 于 
许多 其 他 的 计算 机 技术 ,命令 行 的 知识 是 经 久 不 衰 的 。 今 天 学 会 的 技能 ， 在 10 
年 后 仍然 有 用 。 换 言 之， 命令 行 是 能 够 历经 时 间 考验 的 。 


如 果 读 者 没有 编程 经 验 ， 也 不 用 担心 ， 你 仍然 可 以 从 本 书 开始 学 习 。 


内 容 安排 


本 书 精心 编排 ， 内 容 有 序 ， 就 像 有 一 位 老师 坐 在 你 身 旁 ， 耐 心 指导 你 。 许 
多 作者 都 采用 系统 化 的 方法 来 讲解 本 书 中 的 内 容 。 对 作者 来 讲 ， 这 很 合理 ， 但 


是 对 初学 者 来 讲 ， 则 可 能 摸 不 着 头脑 。 

本 书 的 另 一 个 目的 是 使 读者 熟悉 UNIX 的 思考 方式 ， 它 与 Windows 的 思考 
方式 大 不 相同 。 在 学 习 的 过 程 中 ， 本 书 还 将 帮助 读者 理解 命令 行 的 工作 原理 和 
方式 。Linux 不 仅仅 是 一 个 软件 ， 它 还 是 庞大 的 UNIX 文化 中 的 一 小 部 分 ， 有 着 
自己 的 语言 和 历史 。 同 时 ， 我 也 许 会 说 一 些 过 激 的 言语 。 

本 书 分 为 四 部 分 ， 每 一 部 分 都 讲解 了 不 同方 面 的 命令 行 知识 。 

@ 第 一 部 分 ， 学 习 shell。 开 始 对 命令 行 基本 语言 的 学 习 之 旅 ， 包 括 命 令 

| 结构 、 浏 览 文件 系统 、 编 辑 命 令 行 ， 以 及 查找 命令 帮助 文档 。 

9 第 二 部 分 ， 配置 和 环境 。 这 部 分 主要 讲述 如 何 编 写 配 置 文件 ， 通 过 配 

置 文件 ， 用 命令 行 的 方式 控制 计算 机 操作 。 

@ 第 三 部 分 : 常见 任务 和 主要 工具 。 这 部 分 讲述 了 许多 通过 命令 行 来 执 
行 的 常规 任务 。 类 UNIX 操作 系统 ， 比 如 Linux, 包含 了 很 多 “经 典 的 ” 
命令 行程 序 ， 这 些 程序 可 以 对 数据 进行 强大 的 操作 。 

@ 第 四 部 分 : 编写 shell 脚本 。 这 部 分 介绍 了 shell 编程 ， 这 是 一 个 公认 的 
基本 技能 ， 它 很 容易 学 习 ， 而 且 它 可 以 自动 执行 很 多 常见 的 计算 任务 。 
通过 学 习 shell 编程 ， 你 会 逐渐 熟悉 一 些 关 于 编程 语言 方面 的 概念 ， 这 
些 概 念 也 适用 于 其 他 编程 语言 。 


如 何 阅读 


建议 读者 从 头 到 尾 地 阅读 本 书 。 本 书 并 不 是 一 本 技术 参考 手册 ， 实 际 上 它 
更 像 一 本 故事 书 :， 有 开头 ， 有 过 程 ， 有 结尾 。 


预备 知识 


为 了 使 用 本 书 ， 你 需要 安装 Linux 操作 系统 。 你 可 以 通过 两 种 方式 来 完成 
安装 。 


。 在 计算 机 〔〈 不 需要 是 最 新 的 ) 上 安装 Linux 系统 。 选 择 哪 个 Linux 发 行 
版 本 没有 关系 ， 虽 然 现 在 大 多 数 人 在 开始 的 时 候 会 选择 Ubuntu、Fedora， 或 者 
是 OpenSUSE。 如 果 你 拿 不 准 ， 那 就 先 试 试 Ubuntu。 由 于 主机 硬件 配置 不 同 ， 
安装 Linux 时 ， 你 可 能 不 费 吹 灰 之 力 就 安装 上 了 ， 也 可 能 费 了 九 牛 二 虎 之 力 还 
安装 不 上 。 本 书 建 议 使 用 一 台 几 年 前 的 台式 计算 机 ， 并 且 有 至 少 256MB 的 内 存 
和 6GB 的 空闲 磁盘 空间 。 尽 可 能 避免 使 用 笔记 本 计算 机 和 无 线 网 络 ， 在 Linux 
环境 下 ， 它 们 经 常 不 能 工作 。 

。 使 用 live CD。 许多 Linux 发 行 版 本 都 自 带 一 个 比较 酷 的 功能 , 你 可 以 直 
接 从 CD-ROM 中 运行 Linux， 而 不 必 安 装 Linux。 只 需 进 入 BIOS 设置 界面 ， 设 
置 计算 机 从 CD-ROM 启动 ， 插 入 一 个 live CD， 然 后 重新 启动 。 在 进行 安装 之 
前 ， 使 用 live CD 可 以 检测 计算 机 对 Linux 的 兼容 性 。 但 是 缺点 是 会 比 通过 硬盘 
安装 Linux 要 慢 好 多 。Ubuntu 和 Fedora 都 有 live CD 版 本 。 


注意 无 论 采 用 何 种 方式 来 安装 Linux, 都 将 需要 有 临时 的 超级 用 户 (也 
就 是 管理 员 ) 特权 来 执行 本 书 中 所 讲 的 内 容 。 


在 安装 好 Linux 系统 之 后 ， 就 一 边 开始 阅读 本 书 ， 一 边 练习 吧 。 本 书 大 部 
分 内 容 都 可 以 自己 动手 练习 ， 所 以 坐 下 来 ， 开 始 敲 入 命令 并 体验 吧 。 


本 书 为 什么 不 称 为 “GNU/LINUX” 

在 某 些 领 域 ， 称 Linux 操作 系统 为 “GNU/LINUX 操作 系统 ” 
在 政治 立场 上 是 正确 的 。 没 有 一 个 完全 正确 的 方式 能 命名 它 ， 因 
为 它 是 由 许多 分 布 在 世界 各 地 的 贡献 者 们 合作 开发 而 成 的 。 从 技 
本 层面 来 讲 ，Linux 只 是 操作 系统 的 内 核 名 字 ， 没 有 别 的 含义 . 当 
然 ， 内 核 非常 重要 ， 因 为 有 了 它 ， 操 作 系 统 才能 运行 起 来 ， 但 是 
它 不 能 构成 一 个 完备 的 操作 系统 。 

Richard Stallman 是 一 位 天 才 的 哲学 家 、 自 由 软件 运动 的 创始 
人 、 自 由 基金 会 创办 者 ， 他 创建 了 自由 软件 项 目 ， 编 写 了 GNU C 
语言 编译 器 (GCC ) 的 第 一 个 版 本 ， 并 且 创 建 了 GNU 公用 许可 证 
(GPL ) 等 。 他 坚持 将 Linux 称 为 “GNU/LINUX”， 为 的 是 准确 地 
反映 GNU 项 目 对 Linux 操作 系统 所 做 出 的 贡献 。 尽 管 GNU 项 目 
先 于 Linux 内 核 出 现 ， 并 且 这 个 项 目 所 做 出 的 贡献 得 到 了 极 高 的 
赞誉 ， 但 是 将 GNU 加 入 Linux 名 字 里 面 则 对 其 他 每 一 个 为 Linux 


目 录 


第 一 部 分 “学习 shell 


第 1 章 shell 是 什么 nn 上 i 上 i 上 上】 上】 上 上 人 tt 上 上 tt 上 上 tt 3 
1.1 终端 仿真 器 ooo neato rr. or】 上 att】 上】 上】 】 上】 上】】】 a. 上】 .bn 3 

1.2 第 一 次 键盘 输入 4 
1.2.1 命令 历 史记 录 Senn 上 上 上 4 

1.2.2 ”光标 移动 4 

1.3 几 个 简单 的 命令 oe 上 上 上 5 

1.4 结束 终端 会 话 nt 6 

第 2 章 导航 7 
2.1 理解 文件 系统 树 se 上 上 7 

2.2 当前 工作 目录 Nooo rena 上 上】 上】 上 io】 on】 ne】 8 

2.3 列 出 目 录 内 容 oer 上】 上 上】 上 上 上 9 

2.4 更 改 当 前 工作 目录 TT 9 
2.4.1 绝对 路 径 名 Ce 9 

2.4.2 相对 路 径 名 ne 9 

2.4.3 一 些 有 用 的 快捷 方式 nn 10 

第 3 音 Linux 陛 统 和 ee 13 


3.1 ls 命令 的 乐趣 13 


第 4 章 


4.7 


4.8 


第 5 章 
5.1 
5.2 


5.3 


3.1.1 选项 和 参数 14 
3.1.2 进一步 了 解 长 列表 格式 本 于 15 
使 用 file 命令 确定 文件 类 型 和 16 
使 用 less 命令 查看 文件 肉 容 和 16 
快速 浏览 18 
符号 链接 20 
操作 文件 与 目录 ee 23 
通 配 短 站 nn 24 
mkdir 一 一 创建 目录 Wnt on 上 or】 0】 上 or. 】 .i to tem】 oro... 26 
cp 复制 文件 和 目录 本 26 
my 一 一 移 除 和 重 命名 文件 pp ee 27 
rm 一 一 删除 文件 和 目 录 Dont 上 a 上 28 
ln 一 一 创建 链接 ee 29 
4.6.1 硬 链 接 29 
4.6.2 符号 链接 Co 30 
实 研 注 练 一 ns 30 
4.7.1 创建 目 最 和 pp nn 30 
4.7.2 ”复制 诡 件 en 31 
4.7.3 ”移动 和 重 命 名 文件 31 
4.7.4 ”创建 硬 和 链接 32 
4.7.5 ”创建 符号 链接 33 
4.7.6” 移 除 文件 和 和 目 如 en 34 
本 章 结尾 语 CTT 35 
命令 的 使 用 ee 37 
究 竞 什么 是 命令 nn 38 
识别 命令 0. 38 
5.2.1 type 显示 命令 的 类 型 sn 38 
5.2.2 which 显示 可 执行 程序 的 位 置 es 39 
获得 命令 文档 oo 39 
5.3.1 help 获得 shell 内 置 命令 的 帮助 文档 本 本 和 39 
5.3.2 ”help 显示 命令 的 使 用 信息 .ee 40 
S.3.3 man- 一 一 显示 程序 的 手册 页 站 ee es 40 


5.3.4 apropos 显示 合适 的 命令 ………… nn 41 


显示 命令 的 简要 描述 pe 42 


5.3.5 whatis 
5.3.6 info 显示 程序 的 info 条 目 eee 42 
5.3.7 README 和 其 他 程序 文档 文件 .pe 43 
5.4 使 用 别名 创建 自 已 的 命令 ee 43 
5.5 温 故 以 求 新 TT 45 
第 6 章 重 定 向 ee 47 
6.1 标准 输入 、 标 准 输 出 和 标准 错误 48 
6.1.1 标准 输出 重 定向 ee nn 48 
6.1.2 ”标准 错误 重 定向 全 S0 
6.1.3 ”将 标准 输出 和 标准 错误 重 定向 到 同一 个 文件 .pe 50 
6.1.4 处 理 不 想 要 的 输出 ee S1 
6.1.5 标准 输入 重 定 陪 pe $1 
6.2 管道 S3 
6.2.1 过 滤器 53 
6.2.2 uniq 报告 或 忽略 文件 中 重复 的 行 .pe S4 
6.2.3 we 打印 行 数 、 字 数 和 字 节 数 ee S4 
6.2.4 grep 打印 匹配 行 于 ee 54 
6.2.5 head/tail 输出 文件 的 开头 部 分 /结尾 部 分 站 pe SS 
6.2.6 tee 一 一 从 stdin 读 取 数据 ， 并 同时 输出 到 stdout 和 文件 pp 56 
6.3 本章 结 属 请 57 
第 7 章 有 透 过 shell 看 世 界 S9 
7.1 扩展 S9 
7.1.1 路 径 名 扩展 pe 60 
7.1.2 波浪 线 扩 展 EET EETE TET TLICT TT TT 61 
7.1.3 ”算术 扩展 es 61 
7.1.4 花 括 号 扩展 62 
7.1.5 参数 扩展 63 
7.1.6 命令 替换 TEED TT TT 64 
7.2 引用 65 
7.2.1 双 引 号 TTT 65 
7.2.2 单 引 哥 TT 67 
7.2.3 转 义 字符 ns 67 
7.3 ”本章 结 属 语 生 0 68 


iv 是 录 
第 8 章 高 级 键盘 技巧 和 69 
8.1 编辑 命令 行 onceeosro soto 上 roost rao rar】 rte ior ord no orto a rrr oe rsa er. 69 
8.1.1 光标 移动 en 70 
8.1.2 ”修改 文本 nn 70 
8.1.3 ”前 切 和 粘贴 ( Killing and Yanking ) 文 术 和 ee 71 
8.2 ”自动 补 齐 功 能 71 
8.3 使 用 历史 命令 TT 73 
8.3.1 搜索 历 史 命 令 nt 73 
8.3.2 ”历史 记录 扩展 nn 75 
8.4 本章 结 尾 语 ee 76 
第 9 章 权限 站 77 
9.1 所 有 者 、 组 成 员 和 其 他 所 有 用 户 ee 78 
9.2 读 取 、 写 和 人 和 和 执行 79 
9.2.1 chmod 更 改 文件 模式 pe 81 
9.2.2 采用 GUI 设置 文件 模式 TT 84 
9.2.3 umask 一 一 设置 默认 权限 【nn 85 
9.3 更 改 身 份 生生 生生 生生 生生 生生 和 于 87 
9.3.1 su 以 其 他 用 户 和 组 ID 的 身份 来 运行 shej]1 pe 88 
9.3.2 sudo 以 另 一 个 用 户 的 身份 执行 命令 89 
9.3.3 ”chown 一 一 更 改 文件 所 有 者 和 所 属 群 组 .pe 90 
9.3.4 ”chgrp 一 一 更 收文 件 所属 群 组 se 91 
9.4 权限 的 使 用 站 ee 91 
9.S 更 改 用 户 密 码 en 93 
第 10 章 进程 …… 95 
10.1 进程 如 何 工 作 TT 96 
10.1.1 使 用 ps 命令 查看 进程 信息 ne ee 96 
10.1.2 使 用 top 命令 动态 查看 进程 信息 和 98 
10.2 ”控制 进程 和 100 
10.2.1 中断 进 程 和 ee 100 
10.2.2 使 进程 在 后 台 运 行 … CT 101 
10.2.3 ”使 进程 回 到 前 台 和 运行 Re 101 
10.2.4 ”停止 (暂停 ) 进程 站 102 
10.3 ”信和 刁 和 102 


10.3.1 使 用 Kill 命令 发 送信 号 到 进程 ee 103 

10.3.2 ”使 用 killall 命令 发 送信 号 给 多 个 进程 105 

10.4 更 多 与 进程 相关 的 命令 村 105 

第 二 部 分 “配置 与 环境 

第 11 章 环境 109 
11.1 环境 中 存储 的 是 什么 站 109 
11.1.1 检查 环境 110 

11.1.2 一 些 有 趣 的 变量 村 111 

11.2 环境 是 如 何 建 立 的 ee 上】 上 上 上 上 上 nt】 上】 112 
11.2.1 login 和 non-login shelleeeeeeeeeee 112 

11.2.2 启动 文件 中 有 什么 Geta 上 a 113 

11.3 修改 环境 Ce 114 
11.3.1 用 户 应 当 修 改 哪些 文件 站 pe 114 

11.3.2 文本 编辑 器 en 115 

11.3.3 使 用 文本 编辑 器 nn 115 

11.3.4 ”激活 我 们 的 修 政 en 117 

11.4 本章 结 尾 语 nn 118 
第 全 童 VI 简介 nn 119 
12.1 为 什么 要 学 习 人 119 
12.2 VI 背景 120 
12.3 启动 和 退出 Ds TT 120 
12.4 编辑 模式 ee 121 
12.4.1 进入 播 入 模式 站 ee 122 

12.4.2 ”保存 工作 .ee 122 

12.5 移动 光标 123 
12.6 基本 编辑 和 124 
12.6.1 添加 文本 en 124 

12.6.2 插入 一 行 CRETE TT 125 

12.6.3 ”删除 文本 126 

12.6.4 ”前 切 、 复 制 和 粘贴 文本 es 127 

12.6.5 会 并 行 于 nn 128 

12.7 查找 和 苦 换 …… 人 nn 128 


12.8 


12.9 


第 13 章 
13.1 
13.2 
13.3 
13.4 
13.5 
13.6 


第 14 章 
14.1 
14.2 


14.3 


12.7.1 行内 搜索 ee 128 
12.7.2 搜索 整个 文件 本 129 
12.7.3 全 局 搜索 和 替换 oo 129 
编辑 多 个 文件 ee 130 
12.8.1 切换 文件 eve 131 
12.8.2 载 入 更 多 的 文件 上 上 132 
12.8.3 文件 之 间 的 内 容 复 制 和 ee 132 
12.8.4 插入 整个 文件 TT 133 
保存 工作 134 
定制 提示 符 … TT 135 
提示 符 的 分 解 en 135 
尝试 设计 提示 符 TT 137 
渗 加 颜色 TT 138 
移动 光标 EEETIT TT 140 
保存 提示 符 TT 141 
本 章 结 尾 语 oo 141 
第 三 部 分 “常见 任务 和 主要 工具 
软件 包 管 理 生生 生生 生生 145 
软件 包 系 统 ne 146 
软件 包 系 统 工作 方式 TET 146 
14.2.1 软件 包 文件 和 ee 146 
14.2.2 库 en 147 
14.2.3 ”依赖 美 系 ee 147 
14.2.4 ”高 级 和 低级 软件 包工 瞧 ee 147 
常见 软件 包 管 理 任务 ETT 148 
14.3.1 在 库 里 面 查找 软件 多 pp 148 
14.3.2 ”安装 库 中 的 软件 欠 划 ee 148 
14.3.3 ”安装 软件 包 文件 中 的 软件 筷 se 149 
14.3.4 ”删除 软件 包 ee 149 
14.3.5 更 新 库 中 的 软件 包 eeeeess 150 
14.3.6 更 新 软件 包 文 件 中 的 软件 包 nn 150 


14.3.7 列 出 已 安装 的 软件 包 列 表 150 


14.4 


第 15 章 
15.1 


13.2 


15.3 
15.4 
15.5 
15.6 


15.7 


16.3 


14.3.8 ”判断 软件 包 是 否 安 装 eee nn 151 
14.3.9 ”显示 已 安装 软件 包 的 相关 信息 eee 151 
14.3.10 查看 某 具 体 文件 由 哪个 软件 包 安 装 得 到 nn 151 
本 章 结 尾 语 和 152 
存储 介质 …… 155 
挂 载 、 钊 载 存储 设备 156 
15.1.1 查看 已 挂 载 的 文件 系统 列表 ee. 157 
15.1.2 确定 设备 名 称 LETTTTTTT TT TT 160 
创建 新 的 文件 系统 162 
15.2.1 用 fdisk 命令 进行 磁盘 分 区 et 162 
15.2.2 用 mkfs 命令 创 建新 的 文件 系统 164 
测试 、 修复 文件 系统 RTT TET 165 
格式 化 软盘 ET 166 
直接 从 /向 设备 转移 数据 ………… 166 
创建 CD-ROM 映像 TEETER 167 
15.6.1 创建 一 个 CD-ROM 文件 映像 副本 eons 167 
15.6.2 从 文件 集合 中 创建 映像 文件 ee 168 
向 CD-ROM 写 和 人 映像 文件 EETTTEL TT TTT TT 168 
15.7.1 直接 挂 载 ISO 映像 文件 es 168 
15.7.2 擦 除 可 读 写 CD-ROMeee 169 
15.7.3 写 入 映像 文件 ee 169 
附加 认证 ne 169 
网 络 站 171 
检查 、 监 测 网 络 … 172 
16.1.1 ping 一 一 向 网 络 主机 发 送 特殊 数据 和 包 ee 172 
16.1.2 ”traceroute 一 一 跟踪 网 络 数 据 包 的 传输 路 径 怕 pp 173 
16.1.3 metstat 检查 网 络 设置 及 相 关 统 计数 据 pp 174 
通过 网 络 传输 文件 生生 和 175 
16.2.1 地 一 一 采用 FTP ( 文件 传输 协议 ) 传输 文件 pp 175 
16.2.2 1ftp 一 一 更 好 的 ftp (文件 传输 协议 eee. 177 
16.2.3 Wget 一 一 非 交 互 式 网 络 下 载 工 具 TET TCT 177 
与 远程 主机 的 安全 通信 ee 178 


16.3.1 Ssh 一 一 安全 登录 远程 计算 机 nn 178 


viii 有 目 


第 17 章 
17.1 
17.2 


第 18 章 
18.1 


18.2 


18.3 


第 19 章 
19.1 
19.2 
19.3 
19.4 
19.5 
19.6 


19.7 
19.8 
19.9 


16.3.2 scp 和 sftp 一 一 安全 传输 文件 本 生生 村 181 
文件 搜索 Co 183 
locate 较 简 单 的 方式 查找 文件 和 184 
find 较 复 杂 的 方式 查找 文件 Ne 185 
17.2.1 test 选项 .ee 186 
17.2.2 action 选项 eve 190 
17.2.3 返回 到 playground 文件 天 nn 194 
17.2.4 option 选项 .ee 196 
归档 和 备份 TTT 197 
文件 压缩 oo 198 
18.1.1 gzip 文件 压缩 与 解压 编 和 pe 198 
18.1.2 bzip2 牺 特 速度 以 换取 高 质量 的 数据 压缩 ee 2 200 
文件 归档 CETTE TT TT 201 
18.2.1 tar 一 一 磁带 归档 工具 Gn 201 
18.2.2 zip 打包 压缩 文件 en 205 
同步 文件 和 目录 生生 和 的 207 
18.3.1 rsync 远程 文件 、 目 录 的 同 戎 207 
18.3.2 在 网 络 上 使 用 Tsync 命令 en 209 
正则 表达 式 站 ee 211 
什么 是 正则 表达 式 TETITETT TET TT 211 
grep 一 一 文本 搜索 EET TTT 212 
元 字符 和 文字 ee 213 
任意 字符 TELETT TT TT TT TT 214 
锚 站 214 
中 括号 表达 式 和 字符 类 EEEETTET TET TT 215 
19.6.1 香 定 ee 216 
19.6.2 ”传统 字符 范围 en 216 
19.6.3 POSIX 字符 类 ssn 上 上 上 217 
POSIX 基本 正则 表达 式 和 扩展 正则 表达 式 的 比较 220 
或 选项 221 
限定 符 TTT 222 
19.9.1 ?7 一 一 匹配 某 元 素 0 次 或 二 次 222 


19.9.2 * 


匹配 某 元 素 多 次 或 零 次 es. 222 


19.9.3 “十 一 一 匹配 某 元 素 一 次 或 锣 奖 ee 223 

19.9.4 全 以 指定 次 数 匹 配 菜 元 素 ee 223 

19.10 正则 表达 式 的 应 用 本 224 
19.10.1 用 grep 命令 验证 号 码 薄 国生 村 224 

19.10.2 用 find 查找 奇怪 文件 名 的 文件 pe 225 

19.10.3 ”用 locate 查找 文件 ee 226 

19.10.4 利用 less 和 vim 命令 搜索 文本 和 ee 226 

19.11 本 章 结 尾 语 nn 227 
第 20 章 文本 处 玖 ee 229 
20.1 文本 应 用 程序 en 230 
20.1.1 文件 和 ee 230 

20.1.2 网 页 ee 230 

20.1.3 ”电子 邮件 ee 230 

20.1.4 打印 机 输出 和 ee 231 

20.1.5 程序 源 代 砚 ee 231 

20.2” 温 故 以 求 新 231 
20.2.1 cat 进行 文件 之 间 的 拼接 并 且 输 出 到 标准 输出 ee 231 

20.2.2 gort 对 文本 行进 行 排序 ， 和 ee 232 

20.2.3 uniq 一 一 通知 或 省 略 重 复 的 行 .eve 238 

20.3 切片 和 切 块 生生 生生 村 239 
20.3.1 cut 一 一 删除 文本 行 中 的 部 分 内 容 和 pe 239 
20.3.2 paste 合并 文本 行 …eeeee 242 

20.3.3 joi 连接 两 文件 中 具有 相同 字段 的 行 nn 243 

20.4 文本 比较 ee 245 
20.4.1 “comm- 一 一 逐 行 比较 两 个 已 排序 文件 .pe 245 

20.4.2 ”di 任 一 一 过 行 比较 文件 和 eee, 246 

20.4.3 patch 对 原文 件 进行 di 任 操作 248 

20.5” 非 交互 式 文本 编辑 249 
20.5.1 tr 一 一 桂 换 或 删除 字符 249 

20.$S.2 sed 用 于 文本 过 滤 和 转换 的 流 编 辑 器 nn 251 

20.5.3 aspell 交互 式 拼 写 检查 工具 en 上 na】 上 i 258 

20.6 本 章 结 尾 语 EOE EEE TET TTT TT 260 
20.7 附加 项 ETTTTITTTTT TTT TT 261 


x 目 录 


第 2141 章 格式 化 输 册 站 PP 263 
21.1 简单 的 格式 化 工具 和 ee 264 
21.1.1 nl 一 一 对 行进 行 标 号 ee a 264 
”21.1.2 fold 一 将 文本 中 的 行 长 度 设 定 为 指定 长 度 ee 266 
21.1.3 fimt 简单 的 文本 格式 化 工具 ee 267 
21.1.4 pr 一 一 格式 化 打印 文本 TT 270 

21.1.5 printf 一 一 格式 化 并 打 印 数 握 和 ee 270 

21.2 ”文档 格式 化 系统 ee 273 
21.2.1 ro 人 ff 和 TEX 家族 en 274 

21.2.2 gro 全 一 一 文档 格式 化 系统 ee 274 

21.3 本 章 结 尾 语 生生 生生 279 
第 22 章 打 ED 281 
22.1 打印 操作 简 史 本 和 282 
22.1.1 灰暗 时 期 的 打印 ee 282 

22.1.2 基于 字符 的 打印 机 ee 282 

22.1.3 图形 化 打印 机 ee 283 

22.2 Linux 方式 的 打印 生生 和 284 
22.3 准备 打印 文件 TLLTET ITT TTT 284 
22.3.1 pr 一 一 将 文本 文件 转换 为 打印 文件 ese, ee 285 

22.4 向 打印 机 发 送 打 印 任务 TIT TT 285 
22.4.1 lpr 一 一 打印 文件 ( Berkeley 类 型 ee 286 

22.4.2 了 lp 一 一 打印 文件 ( Systema V 类 一 Oe 287 

22.4.3 另外 一 个 参数 选项 : ADP 287 

22.5 ”监测 和 控制 打印 任务 290 
22.5.1 lpstat 一 一 显示 打印 系统 状态 ees ee 290 

22.5.2 lpq 最 示 打 印 队 列 状态 和 ees 291 

22.5.3 ”lprm 与 cancel 一 一 租 除 打印 任务 ee 291 

第 23 章 编译 程序 293 
23.1 什么 是 编译 TT 294 
23.2 是 不 是 所 有 的 程序 都 需要 编译 RN ee 295 
23.3 编译 一 个 C 程序 …… 生生 295 
23.3.1 获取 源 代 而 296 


23.3.2 ”检查 源 代 码 栅 297 


23.4 


第 24 章 
24.1 
24.2 


24.3 


24.5 


第 25 章 
25.1 
25.2 
25.3 


25.4 
25.5 


第 26 章 
26.1 
26.2 
26.3 
26.4 


第 27 章 
27.1 
27.2 


pT 
23.3.4 ”安装 程序 ee 
本 章 结 属 请 和 


第 四 部 分 “编写 shell 脚本 


编写 第 一 个 shell 脚 杰 .ee 
什么 是 shell 脚 杰 和 
怎样 写 shell 脚 杰 
24.2.1 脚本 文件 的 格式 和 
24.2.2 ”可 执行 权限 .ee 
24.2.3 ”脚本 文件 的 位 置 和 pp 
24.2.4 脚本 的 理想 位 置 .pe 
更 多 的 格式 庄 窒 nn 


启动 一 个 项 目 nmi 上 上 上 ti 上 上 i】 上 .i 上 上 ii 上 上 上 a 上 ail 
第 一 阶段 : 最 小 的 文 梢 
第 二 阶段 ， 加 和 一片 数据 


25.3.1 创建 变量 和 常量 .pp 
25.3.2 ”为 变量 和 常量 贱 值 和 Ne 


保持 脚本 的 运行 TT 
本 章 结 尾 语 en 


xii 目 


27.3 


27.4 
27.5 
27.6 
27.7 
27.8 


第 28 章 
28.1 


28.2 
28.3 
28.4 
28.5 


第 29 章 
29.1 
29.2 
29.3 
29.4 
29.5 
29.6 


第 30 章 
30.1 


30.2 


30.3 


录 
使 用 test 命令 332 
27.3.1 文件 表达 式 tt tt 332 
27.3.2 字符 事 表 达 匠 nn 334 
27.3.3 整数 表达 式 en 335 
更 现代 的 test 命令 版 林 和 ee 336 
(()) 一 为 整数 设计 338 
组 合 表达 式 oe 339 
控制 运算 符 :; 另 一 种 方式 的 分 支 en 341 
本 章 结 尾 语 Wo 342 
读 取 键盘 输入 -PP 343 
read 从 标准 输入 读 取 输入 值 划 pp 344 
28.1.1 选项 346 
28.1.2 使 用 IFS 间隔 输入 字段 和 347 
验证 输入 Cr 349 
菜单 Co 350 
本 章 结 尾 语 Co 351 
附加 项 ee Se 352 
流 控制 ，WHILE 和 UNTIL 循环 353 
循环 353 
while ee 354 
跳出 循环 356 
Until ee 357 
使 用 循环 读 取 文件 TT 358 
本 章 结 尾 语 村 生生 下 358 
故障 诊断 359 
语法 错误 和 359 
30.1.1 引号 铀 失 ee 360 
30.1.2 ”符号 缺失 完 剑 和 ee 360 
30.1.3” 非 预期 的 展开 .PP 361 
人 逻辑 错误 362 
30.2.1 防御 编程 nn 363 
30.2.2 ”输入 值 验证 站 pp 364 


30.4 


30.5 


第 31 章 
31.1 


31.2 


第 32 章 
32.1 


32.2 
32.3 
32.4 

第 33 章 
33.1 
33.2 
33.3 


第 34 章 
34.1 


34.2 


30.3.1 。” 桩 ee 365 
30.3.2 ”测试 用 例 365 
调试 366 
30.4.1 找到 问题 拒 站 ee 366 
30.4.2 个 足 ee 366 
30.4.3 运行 过 程 中 变量 的 检验 和 pp 368 
本 章 结尾 语 划 ee 369 
流 控制 ， case 分支 371 
CASE 371 
31.1.1 模式 和 373 
31.1.2 多 个 模式 的 组 合 瑟 ee nn 374 
本 章 结 尾 语 TT 375 
位 置 参半 PP 377 
访问 命令 行 计生 于 377 
32.1.1 确定 实 参 的 数目 和 pp 378 
32.1.2。 ”shift 一 一 处 理 大 量 的 实 参 nn 379 
32.1.3 简单 的 应 用 程序 .ee 380 
32.1.4 在 shell 函数 中 使 用 位 置 套 数 nn 381 
处 理 儿 个 位 置 参数 PP 381 
更 完整 的 应 用 程序 Ps 383 
本 章 结尾 语 eeeee es 386 
流 控 制 : for 循环 ee 389 
for， 传统 shell 形式 eee ee 389 
for，C 语言 形 戒 nn 392 
本 章 结 尾 语 nora 上】 上 上 上 上 393 
字符 串 和 数字 .ee 395 
参数 扩展 (Parameter Expansion) ee 395 
34.1.1 基本 参数 nn 396 
34.1.2 空 变量 扩展 的 管理 本 396 
.34.1.3 返回 变量 名 的 扩展 397 
34.1.4 字符 囊 操 作 呈 ee 398 
算术 计算 和 扩 殿 ee 400 


Xiv 目 


34.3 


34.4 
34.5 
第 35 章 
35.1 
35.2 
35.3 
35.4 
35.5 


35.6 


第 36 章 
36.1 


36.2 
36.3 
36.4 


36.5 


录 


34.2.2 ”一 元 运算 适 ee 401 
34.2.3 ”简单 算术 401 
34.2.4 贼人 和 值 nn 402 
34.2.5 ”位 操作 ee 404 
34.2.6 ”逻辑 操作 nn 405 
bec; 一 种 任意 精度 计算 语言 ……eeeeseeees 和 ees. 407 
34.3.1 be 的 使 用 ee 上 上】 上 上 上 407 
34.3.2 脚本 例子 en 408 
本 章 结 尾 语 nn 409 
附加 开 … 409 
数组 … 411 
什么 是 数组 411 
创建 一 个 数组 站 PN 412 
数组 赋值 ， 和 PP 412 
访问 数组 元 于 Nt 413 
数组 操作 TT TL TET TT TT 414 
35.5.1 输出 数组 的 所 有 内 容 pe 415 
35.5.2 ”确定 数组 元 素 的 数目 ee 415 
35.5.3 ”查找 数组 中 使 用 的 下 标 站 pp 416 
35.5.4 在 数组 的 结尾 增加 元 素 ETT TEEETTTT ETT TT 416 
35.5.5 ”数组 排序 操作 ess 416 
35.5.6 ”数组 的 删除 ee 417 
本 章 结 尾 语 TEETER 418 
其 他 命令 419 
组 命令 和 子 She 由 419 
36.1.1 执行 重 定 向 站 Ne 420 
36.1.2 ”进程 替换 站 420 
trapee 422 
异步 执行 TEED TEETER ETT 425 
命名 管道 TT TT TE TT TT 426 
36.4.1 设置 命名 管道 ee 427 
36.4.2 使 用 命名 管道 427 


本 章 结 尾 语 TT RT TTT TT 428 


第 一 部 分 


学 习 shell 


第 人 六 


shell 是 什么 


当 谈 到 命令 行 时 ， 我 们 实际 上 指 的 是 shell。shell 是 一 个 接收 由 键盘 输入 的 
命令 ， 并 将 其 传递 给 操作 系统 来 执行 的 程序 。 几 乎 所 有 的 Linux 发 行 版 都 提供 
shell 程序 ， 该 程序 来 自 于 称 之 为 bash 的 GNU 项 目 。bash 是 Bourne Again Shell 的 
首 字 母 缩写 ，Bourne Again Shell 基于 这 样 一 个 事实 ， 即 bash 是 sh 的 增强 版 本 ， 
而 sh 是 最 初 的 UNIX shell 程序 ， 由 Steve Bourne 编写 。 


1.1 终端 仿真 器 


当 使 用 图 形 用 户 界 面 时 ， 需 要 另 一 种 叫做 终端 仿真 器 (terminal emulator ) 
的 程序 与 shell 进行 交互 。 如 果 我 们 仔细 查看 桌面 菜单 ， 那 么 很 可 能 会 找到 一 
款 终 端 仿真 器 。 在 KDE 环境 下 使 用 的 是 konsole， 而 在 GNOME 环境 下 使 用 的 
是 gnome-terminal， 但 是 在 桌面 菜单 上 很 可 能 将 它们 简单 地 统称 为 终端 。 在 Linux 
系统 中 ， 还 有 许多 其 他 的 终端 仿真 器 可 以 使 用 ， 但 是 它们 基本 上 都 做 同样 的 事 
情 : 让 用 户 访 问 shell。 因 为 不 同 的 终端 仿真 器 所 具有 的 功能 特性 不 尽 相 同 ， 因 
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此 ， 你 可 以 根据 自己 的 喜好 进行 选择 。 


1.2 第 一 次 键盘 输入 
现在 开始 吧 。 启 动 终端 仿真 器 ! 运行 后 的 终端 仿真 器 如 下 所 示 。 


[meelinuxbox -~]$ IT 

这 称 为 shell 提示 符 ， 只 要 shell 准备 接受 外 部 输入 ， 它 就 会 出 现 。 在 不 同 的 发 
行 版 中 , 提示 符 的 外 观 可 能 会 有 所 差异 , 但 是 , 它 通常 包括 usermameG@machinename， 
其 后 是 当前 工作 目录 (长 度 更 长 一 些 ) 和 一 个 4 符号 。 

如 果 shell 提示 符 的 最 后 一 个 字符 是 #， 而 不 是 一 个 $ 符 号 ， 那 么 终端 会 话 将 
享有 超级 用 户 特权 。 这 就 意味 着 要 么 我 们 是 以 根 用 户 身份 登录 ， 要 么 我 们 选择 
的 终端 仿真 器 可 以 提供 超级 用 户 〈 管 理 ) 特权 。 

假定 一 切 工作 都 很 顺利 ， 接 下 来 尝试 输入 一 些 内 容 。 在 提示 符 后 输入 一 些 
乱码 ， 如 下 所 示 。 

[me@linuxbox ~]$ kaekfjaeifj 


由 于 这 些 命令 没有 任何 意义 ，shell 会 让 我 们 重新 输入 。 


bash: kaekfjaeifj: command not found 
[me@linuxbox ~]$ 


1.2.1 命令 历史 记录 


如 果 按 下 向 上 方向 指示 键 ， 将 会 看 到 先前 的 命令 kaekfjaei 再 一 次 出 现在 
提示 符 的 后 面 ， 这 称 为 命令 历史 记录 。 在 默认 情况 下 ， 大 部 分 Linux 发 行 版 本 
能 够 存储 最 近 输 入 的 500 个 命令 。 按 下 向 下 方向 指示 键 ， 则 先前 的 命令 消失 。 


1.2.2 ”光标 移动 


再 次 按 下 向 上 方向 指示 键 ， 重 新 调用 先前 的 命令 ， 然 后 分 别 按 下 向 左 和 向 右 方向 
指示 键 , 看 看 如 何 将 光标 定位 到 命令 行 的 任意 位 置 。 这 可 以 让 我 们 很 容易 地 编辑 命令 。 


关于 上 妃 标 与 焦点 
尽管 shell 与 用 户 的 交互 全 部 是 通过 键盘 来 完成 的 ， 但 是 在 终端 仿真 器 中 ， 
也 可 以 使 用 息 标 。 内 置 到 义 窗口 系统 (驱动 GUI 的 底层 引擎 ) 中 的 一 种 机 制 
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可 以 支持 快速 的 复制 与 粘贴 技术 。 如 果 紧 按 鼠 标 左 键 选 中 一 些 文本 并 拖 动 鼠 
标 (或 双击 选中 一 个 词 )， 该 文本 将 复制 到 由 XXX 维护 的 一 个 缓冲 区 中 。 按 下 和 鼠 
标的 中 间 按 键 可 以 将 选中 的 文本 粘贴 到 光标 所 在 的 位 置 。 你 可 以 试 一 下 。 

不 要 试图 使 用 Ctrl-C 和 Ctrl-V 在 一 个 终端 窗口 内 进行 复制 和 粘贴 操作 ， 
这 不 起 作用 。 对 于 shell 而 言 ， 这 些 组 合 键 在 很 早 之 前 就 已 经 赋予 了 不 同 的 含 
义 ， 而 那 时 微软 的 Windows 操作 系统 还 没有 出 现 。 

在 操作 上 与 Windows 类 似 的 图 形 素面 环境 (很 有 可 能 是 KDE 或 
GNOME )， 很 可 能 拥有 自己 的 焦点 策略 (focus policy ) 集合 ， 用 以 通过 “点 
击 来 获得 焦点 ”。 这 意味 着 ， 如 果 一 个 窗口 需要 获得 焦点 (成 为 当前 窗口 )， 只 
需要 点 击 一 下 即 可 。 而 传统 的 义 窗口 的 行为 是 “焦点 跟随 着 筷 标 ”?， 也 就 是 说 ， 
当 息 标 经 过 窗口 时 ， 窗 口 就 会 获得 焦点 。 因 此 两 者 是 截然 不 同 的。 如 果 没 有 点 
击 窗口 ， 那 么 它 不 会 出 现在 前 端 ， 但 此 时 它 可 以 接受 输入 。 将 焦点 策略 设置 为 
“焦点 跟随 鼠标 ”的 方式 会 使 终端 窗口 使 用 起 来 更 容易 。 试 一 试 吧 ， 试 过 之 后 ， 
你 一 定 会 喜欢 上 这 种 方式 。 你 可 在 窗口 管理 器 的 配置 程序 中 找到 该 设置 。 


1.3” 几 个 简单 的 命令 


在 学 习 了 键盘 输入 之 后 ， 我 们 来 尝试 几 个 简单 的 命令 。 首 先是 date 命令 ， 
该 命令 显示 当前 系统 的 时 间 和 日 期 。 


[me@linuxbox ~]$ date 
Thu Oct 25 13:51:54 EDT 2012 


与 之 相关 的 一 个 命令 是 cal， 在 默认 情况 下 ，cal 显示 当月 的 日 历 。 


{me@linuxbox ~]$ cal 
October 2012 

Su Mo Tu We Th Fr Sa 
1 2 3 4 5 6 

7 8 91011 12 13 

14 15 16 17 18 19 20 

21 22 23 24 25 26 27 

28 29 30 31 


如 果 想 要 查看 磁盘 驱动 器 当前 的 可 用 空间 ， 可 以 使 用 df 命令 。 


[Ime@linuxbox ~]$ df 


Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/sda2 15115452 5012392 9949716 34% / 
/dev/sda5 59631908 26545424 30008432 47% /home 
/dev/sdai 147764 17370 122765 13% /boot 


tmpfs 256856 0 256856 0% /dev/shm 
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同样 ， 要 显示 可 用 内 存 ， 可 以 使 用 free 命令 。 


[meelinuxbox ~]$ free 


total used free shared buffers cached 
Mem: 513712 503976 9736 0 5312 122916 
-/+ buffers/cache: 375748 137964 
Swap: .1052248 104712 947536 


1.4 ”结束 终端 会 话 


直接 关闭 终端 窗口 或 是 在 shell 提示 符 下 输入 exit 命令 ， 即 可 结束 终端 会 话 。 


[me@linuxbox ~]$ exit 


幕后 的 控制 台 

即使 没有 运行 终端 仿真 器 ， 一 些 终端 会 话 也 会 在 图 形 桌 面 的 后 台 运行 。 
这 叫做 虚拟 终端 或 是 虚拟 控制 台 。 在 绝 大 多 数 系统 中 ， 通 过 依次 按 下 
Ctrl-Alt-F1 键 到 Ctrl-Alt-F6 组 合 键 ， 可 以 访问 大 部 分 Linux 发 行 版 中 的 终端 会 
话 。 每 当 访问 一 次 会 话 ， 就 会 出 现 登 录 提 示 符 ， 我 们 可 以 在 其 中 输入 用 户 名 
和 密码 。 按 Alt 和 Fl1~F6 键 , 可 从 一 个 虚拟 控制 台 转换 到 另 一 个 虚拟 控制 台 . 
按 Alt-F7 键 可 返回 图 形 桌 面 环境 . 


第 章 
导 航 


除了 在 命令 行进 行 输入 操作 之 外 ， 我 们 首先 需要 学 习 的 是 如 何在 Linux 系 
统 中 导航 文件 系统 。 本 章 将 介绍 下 述 命令 。 


。 pwd: 查看 当前 工作 目录 。 
e cd: 改变 目录 。 
e。 1ls: 列 出 目录 内 容 。 


2.1 理解 文件 系统 树 


与 Windows 相同 ， 类 UNIX 操作 系统 (比如 Linux) 也 是 以 称 之 为 分 层 目 
录 结 构 的 方式 来 组 织 文 件 的 。 这 意味 着 文件 是 在 树 形 结构 的 目录 (有 时 在 其 他 
系统 中 称 为 文件 夹 ) 中 进行 组 织 的 ， 该 树 形 结构 目录 可 能 包含 文件 和 其 他 目录 。 
文件 系统 的 第 一 个 目录 叫做 根 目 录 ， 它 包含 了 文件 和 子 目 录 。 子 目录 里 包含 了 
更 多 的 文件 和 子 目 录 ， 依 此 类 推 。 
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需要 注意 的 是 ， 在 Windows 系统 中 ， 每 个 存储 设备 都 有 一 个 独立 的 文件 
系统 树 。 而 在 类 UNIX 系统 中 ， 如 Linux， 无 论 多 少 驱 动 器 或 存储 设备 与 计算 
机 相连 ,通常 只 有 一 个 文件 系统 树 。 根 据 系 统管 理 员 的 设置 ， 存储 设备 将 会 连 
接 (更 准确 的 说 是 “ 挂 载 ”) 到 文件 系统 树 的 不 同位 置 。 系 统管 理 员 要 负责 系 
统 的 维护 。 


2.2 ”当前 工作 目录 


可 能 大 部 分 人 都 熟悉 用 于 表示 文件 系统 树 的 图 形 文件 管理 器 ， 如 图 2-1 所 
示 。 需 要 注意 的 是 ， 树 通常 是 倒立 显示 的 。 也 就 是 说 ， 顶 部 是 根 目录 ， 依 次 向 
下 排列 的 是 子 目 录 。 


nlightenment 
‘gnome 
.gnome- desktop 


图 2-1 在 图 形 文件 管理 器 中 显示 的 文件 系统 树 


然而 ， 由 于 命令 行 没 有 图 像 ， 若 是 要 浏览 文件 系统 树 ， 就 必须 使 用 其 他 
方法 。 

假设 文件 系统 是 一 个 迷宫 ， 形 如 一 棵 倒置 的 树 ， 并 且 用 户 处 在 文件 系统 之 
中 。 任 何 时 刻 ， 我 们 处 在 单个 目录 中 ， 能 够 看 到 该 目录 中 包含 的 文件 、 去 往 上 
一 级 目录 〔 称 为 父 目录 〉 的 路 径 ， 以 及 下 一 级 的 各 个 子 目 录 。 用 户 所 处 的 目录 
叫做 当前 工作 目录 。 使 用 pwd《〈 打 印 工作 目录 ) 命令 可 以 显示 当前 工作 目录 。 


[me@linuxbox ~]$ pwd 
/home/me 


第 一 次 登录 系统 时 (或 是 启动 终端 仿真 器 会 话 时 )， 当 前 工作 目录 被 设置 成 
主 目录 。 每 个 用 户 账号 都 有 一 个 主 目录 ， 作 为 普通 用 户 操作 时 ， 这 是 唯一 一 个 
允许 用 户 写 文件 的 地 方 。 
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2.3” 列 出 目录 内 容 
使 用 ls 命令 可 以 列 出 当前 工作 目录 的 文件 和 目录 。 


[me@linuxbox -~]$ 1s 
Desktop Documents Music Pictures Public Templates Videos 


实际 上 , 可 以 使 用 1s 命令 列 出 任何 目录 的 内 容 , 而 不 仅仅 是 当前 工作 目录 。 
同时 ， 它 还 拥有 一 些 其 他 有 趣 的 功能 。 我 们 会 在 第 3 章 详细 讨论 ls 命令 。 


2.4 更改 当前 工作 目录 


使 用 cd 命令 可 以 改变 工作 目录 〈 即 在 文件 系统 树 的 位 置 ); 只 需 输入 cd 命 
令 ， 然 后 再 输入 目标 工作 目录 的 路 径 名 即 可 。 路 径 名 指 的 是 沿 着 分 枝 到 达 目 标 目 
录 的 路 由 。 路 径 名 分 为 两 种 : 绝对 路 径 名 和 相对 路 径 名 。 首 先 来 谈 谈 绝 对 路 径 名 。 


2.4.1 绝对 路 径 名 


绝对 路 径 名 从 根 目录 开始 ， 其 后 紧 接着 一 个 又 一 个 文件 树 分 支 ， 直 到 到 达 
目标 目录 或 文件 。 例 如 ， 系 统 里 有 一 个 目录 ， 大 多 数 系统 程序 都 安装 到 这 个 目 
录 里 ， 该 目录 的 路 径 名 是 /uswbin。 这 就 意味 着 根 目录 〈 在 路 径 名 中 用 前 导 斜 杠 
来 表示 ) 中 有 一 个 目录 是 usr， 该 目录 包含 一 个 bin 目录 。 


[meeLinuxbox ~]$ cd /usr/bin 
[meelinuxbox bin]$ pwd 

/usr/bin 

[me@linuxbox bin]$ 1s 

.. .Listing of many, many files ... 


可 以 看 到 , 我们 已 经 将 当前 工作 目录 改变 成 /usr/bin，bin 目录 中 包含 很 多 文 
件 。 请 注意 shell 提示 符 是 如 何 变 化 的 。 为 方便 起 见 ， 工 作 目 录 名 通常 被 设置 成 
自动 显示 。 


2.4.2 ”相对 路 径 名 
绝对 路 径 名 是 从 根 目录 开始 ， 通 向 目标 目录 ， 而 相对 路 径 名 则 是 从 工作 目 
录 开 始 的 。 为 了 实现 这 个 目的 ， 它 通常 使 用 一 些 特 殊 符号 来 表示 文件 系统 树 中 
的 相对 位 置 ， 这 些 特殊 符号 是 “.”( 点 ) 和 “..”( 点 点 )。 
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2.4.3 


符号 “.” 代 表 工 作 目 录 ， 符 号 “..” 代 表 工 作 目录 的 父 目 录 。 下 面 演 示 它 们 
是 如 何 工作 的 。 让 我 们 再 次 将 工作 目录 改变 成 /asrbin。 
[meeiinuxbox -8 cd /usr/bin 


[me@linuxbox bin]$ pwd 
Ausr/bin 


好 的 ， 下 面 来 说 明 一 下 ， 我 们 希望 将 工作 目录 改变 成 /usr/bin 的 父 目录 ， 即 
/usr。 有 两 种 方法 可 以 实现 ， 一 种 是 使 用 绝对 路 径 名 。 


[meelinuxbox bin]$ cd /usr 
[me@linuxbox usr]l$ pwd 
/usr 


另 一 种 是 使 用 相对 路 径 名 。 


[meelinuxbox bin]$ cd .. 
fmeelinuxbox USr]$ pwd 
/usr 


由 于 两 种 不 同 的 方法 产生 同样 的 结果 。 那 么 我 们 究竟 应 该 用 哪 一 种 方法 
呢 ? 那 就 选择 输入 字符 最 少 的 吧 。 


同样 ， 可 以 用 两 种 方法 将 工作 目录 从 /usr 变 到 /usr/bin。 我 们 可 以 使 用 绝 
对 路 径 名 。 
[me@linuxbox usr]$ cd /usr/bin 


[me@linuxbox bin]$ pwd 
/usr/bin 


我 们 也 可 以 使 用 相对 路 径 名 。 


[me@linuxbox usr]$ cd ./bin 
[me@liinuxbox bin1$ pwd 
/usr/bin 


必须 在 这 里 指出 来 的 是 ， 几 乎 在 所 有 的 情况 下 都 可 以 省 略 “./” 因为 它 是 
隐 含 的 。 输 入 以 下 代码 。 


[me@linuxbox usr]$ cd bin 


该 代码 与 使 用 相对 路 径 名 的 代码 具有 相同 效果 。 一 般 而 言 ， 如 果 没 有 指定 路 径 


名 ， 则 默认 为 工作 目录 。 


一 些 有 用 的 快捷 方式 


表 2-1 列 出 了 一 些 可 以 快速 改变 当前 工作 目录 的 方法 。 
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表 2-1 cd 快捷 方式 


a 将 工作 目录 改变 成 主 目录 
cd- 将 工作 目录 改变 成 先前 的 工作 目录 
cd~username 将 工作 目录 改变 为 username 的 主 目录 。 例如，cd~bob 将 目录 改变 成 用 户 bob 的 主 目 


第 马 


Linux 系统 


既然 已 经 知道 了 如 何在 文件 系统 中 跳 转 ， 是 时 候 开 始 Linux 操作 系统 之 
旅 了 。 但 是 ， 在 开始 之 前 ， 我 们 要 先 学 习 一 些 对 研究 Linux 系统 很 有 帮助 的 
命令 。 


。 ls: 列 出 目录 内 容 。 
。 file: 确定 文件 类 型 。 
e iess: 查看 文件 内 容 。 


3.1 ls 命令 的 乐趣 


有 充分 的 理由 证 明 ，ls 命令 很 可 能 是 用 户 最 常 使 用 的 命令 。 通 过 ls 命令 可 
以 查看 目录 内 容 ， 确 定 各 种 重要 文件 和 目录 的 属性 。 我 们 已 经 看 到 ， 只 需 输 入 
ls 命令 ， 即 可 查看 当前 工作 目录 中 包含 的 一 系列 文件 和 子 目 录 。 
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[me@linuxbox ~]$ 18 | 
Desktop Documents Nusic Pictures Public Templates Videos 


除了 当前 工作 目录 之 外 ， 我 们 还 可 以 指定 要 显示 的 目录 ， 如 下 所 示 。 
me@linuxbox -]$ ls /usr 
bin games kerberos libexec sbin src 
etc include lib local share tmp 

我 们 甚至 可 以 指定 多 个 目录 。 下 面 这 个 例子 就 列 出 了 用 户主 目录 (由 符号 
“一 ”表示 ) 和 /usr 目录 的 内 容 。 


[meelinuxbox ~]$ 1s ~ /usr 


/home/me: 

Desktop Documents Music Pictures Public Templates Videos 
Jusr: 

bin games kerberos libexec sbin src 

etc include lib local share tmp 


我 们 也 可 以 改变 输出 格式 来 得 到 更 多 细节 。 


[me@linuxbox -]$ ls -1 

total 56 

drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Desktop 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Documents 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Music 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Pictures 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Public 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Templates 
drwxrwxr-x 2 me me 4096 2012-10-26 17:20 Videos 


在 命令 中 加 上 -1， 我 们 可 以 将 输出 以 长 格式 显示 。 


3.1.1 选项 和 参数 


下 面 ， 让 我 们 来 了 解 一 下 大 部 分 命令 是 如 何 工 作 的， 这 也 是 非常 重要 的 一 
点 。 通 常 ， 命 令 后 面 跟 有 一 个 或 多 个 选项 ， 带 有 不 同 选项 的 命令 其 功能 也 不 一 
样 。 此 外 ， 命 令 后 面 还 会 跟 有 一 个 或 多 个 参数 ， 这 些 参数 是 命令 作用 的 对 象 。 
所 以 大 部 分 命令 看 起 来 如 下 所 示 : 


command -options arguments 


大 部 分 命令 使 用 的 选项 是 在 单个 字符 前 加 上 连 字 符 ， 如 -1。 但 是 ， 很 多 命令 ， 
包括 GNU 项 目 里 的 命令 ， 也 支持 在 单字 前 加 两 个 连 字符 的 长 选项 。 而 且 ， 很 多 
命令 也 允许 多 个 短 选 项 串 在 一 起 使 用 。 在 下 面 的 例子 中 ，ls 命令 包含 了 两 个 选项 ; 
1 选项 产生 长 格式 输出 ， 而 + 选项 则 表示 以 文件 修改 时 间 的 先后 将 结果 进行 排序 。 


[me@linuxbox ~]$ ls -1t 


加 上 长 选项 - -reverse， 则 结果 会 以 相反 的 顺序 输出 : 


[meelinuxbox ~]$ ls -1t --reverse 


ls 命令 有 大 量 可 用 的 选项 。 最 常用 的 选项 如 表 3-1 所 示 。 
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表 3-1 ls 命令 的 常用 选项 
选项 长 选项 含义 
本 列 出 所 有 文件 ， 包 括 以 点 号 开头 的 文件 ， 这 些 文件 通常 是 不 列 出 
2 一 来 的 《比如 隐藏 的 文件 ) 
通常 ， 如 果 指定 了 一 个 目录 ，is 命令 会 列 出 目录 中 的 内 容 而 不 是 
-d --directory 目录 本 身 。 将 此 选项 与 -1 选项 结合 使 用 ， 可 查看 目录 的 详细 信息 ， 
而 不 是 目录 中 的 内 容 
总 ly 选项 会 在 每 个 所 列 出 的 名 字 后 面 加 上 类 型 指示 符 〔 例 如 ， 如 果 名 
字 是 目录 名 ， 则 会 加 上 一 个 斜 杠 ) 
h --human-readable 。 以 长 格式 列 出 ， 以 人 们 可 读 的 方式 而 不 是 字 节 数 来 显示 文件 大 小 
-1 使 用 长 格式 显示 结果 
以 相反 的 顺序 显示 结果 。 通 常 ，ls 命令 按照 字母 升序 排列 显示 
= =-ITeVeTS6 结 果 
-S 按 文件 大 小 对 结果 排序 
t 按 修改 时 间 排 序 


3.1.2 进一步 了 解 长 列表 格式 


前 面 看 到 ，-! 选项 使 得 ls 命令 以 长 格式 显示 其 结果 。 这 种 格式 包含 了 大 量 
的 有 用 信息 。 下 面 的 例子 来 自 Ubuntu 系统 。 


-rw-r--r-- 


root 


root 3576296 2012-04-03 11:05 Experience ubuntu.ogg 


-PW-r--r-- 
-rw-r--r-- 
-rw-r--F-- 
-rw-r--r-- 


-rw-r--r-- 
-rw-Tr--r-- 
-Fw-r--r-- 
-rw-F--r-- 
-rw-r--r-- 


再 来 看 一 下 其 中 一 个 文件 的 不 同 字段 ， 表 3-2 列 出 了 这 些 不 同 字段 的 含义 。 


1 
1 
1 
1 
1 
-rw-r--r-- 1 
1 
1 
1 
1 
1 


root 
root 
root 
root 
root 
root 
root 
root 
root 
root 


root 1186219 2012-04-03 11:05 kubuntu-leaflet.png 


root 
root 
root 
root 
root 
root 
root 
root 
root 


47584 2012-04-03 
44355 2012-04-03 
34391 2012-04-03 
32059 2012-04-03 
159744 2012-04-03 
27837 2012-04-03 
98816 2012-04-03 
453764 2012-04-03 
358374 2012-04-03 


11 
11 
11 
11 
11 
11 
11 
11 
11 


:05 logo-Edubuntu.png 
:05 lo0ogo-Kubuntu.png 
:05 logo-Ubuntu.png 
:05 o00-cd-cover .odf 
:05 ov0-derivatives.doc 
:05 v0-maxwell.odt 

:05 o00-trig.xls 

:05 ovo0-welcome .odt 

:05 ubuntu Sax.ogg 


表 3-2 ls 长 列表 字段 
字段 含义 

对 文件 的 访问 权限 。 第 一 个 字符 表示 文件 的 类 型 。 在 不 同类 型 之 闻 , 开头 的 “-” 
ee 表示 该 文件 是 一 个 普通 文件 ，d 表示 目录 。 紧 接着 的 三 个 字符 表示 文件 所 有 者 


的 访问 权限 ， 再 接着 的 三 个 字符 表示 文件 所 属 组 中 成 员 的 访问 权限 ， 最 后 三 个 
字符 表示 其 他 所 有 人 的 访问 权限 。 详 细 解释 请 见 第 9 章 
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续 表 
字段 < 
1 文件 硬 链接 数目 。 链 接 的 内 容 将 在 本 章 后 面 讨 论 
root 文件 所 有 者 的 用 户 名 
root 文件 所 属 用 户 组 的 名 称 
32059 以 字 节 数 表 示 的 文件 大 小 
2012-04-03 11:05 上 次 修改 文件 的 日 期 和 时 间 
00-cd-cover.odf 文件 名 


3.2 ”使 用 file 命令 确定 文件 类 型 


在 我 们 探索 系统 的 过 程 中 ， 知 道 文件 包含 的 内 容 是 非常 有 用 的 。 为 此 ， 我 们 可 以 
使 用 file 命令 来 确定 文件 类 型 。 先 前 讲 过 ，Linux 系统 中 的 文件 名 不 需要 反映 文件 的 
内 容 。 例 如 ， 当 我 们 看 到 picturejpg 这 样 一 个 文件 名 ， 会 很 自然 地 觉得 该 文件 中 包含 
一 张 JPEG 压缩 图 像 , 但 是 在 Linux 中 却 没 有 这 个 必要 。 我们 可 以 这 样 调用 file 命令 : 
file filename 


调用 后 ，file 命令 会 打印 出 文件 内 容 的 简短 说 明 。 例 如 : 


[me@linuxbox ~]$ file picture.jpg 
picture.jpg: JPEG image data, JFIF standard 1.01 


文件 的 种 类 有 很 多 。 事 实 上 ， 在 类 UNIX 操作 系统 比如 Linux 系统 ) 中 ， 
有 个 普遍 的 观念 是 “所 有 的 东西 都 是 一 个 文件 ”。 随 着 课程 的 深入 ， 大 家 会 明白 
这 句 话 的 真 详 。 

尽管 我 们 已 经 很 熟悉 系统 中 的 许多 文件 ， 比 如 MP3 和 JPEG 文件 。 但 是 也 
有 一 些 文件 比较 含蓄 ， 还 有 一 些 文件 对 我 们 而 言 相当 陌 生 。 


3.3 ”使 用 less 命令 查看 文件 内 容 


less 命令 是 一 种 查看 文本 文件 的 程序 。 纵 观 Linux 系统 ， 很 多 文件 都 含有 人 
们 可 以 阅读 的 文本 。less 程序 为 我 们 查看 文件 提供 了 方便 。 


为 什么 要 查看 文本 文件 昵 ? 因 为 包含 系 统 设置 的 多 数 文 件 ( 即 配置 文件 ) 
是 以 这 种 格式 存储 的 ， 阅 读 这 些 文件 有 利于 更 好 地 理解 系统 是 如 何 工作 的 。 此 
外 ， 系 统 使 用 的 许多 实际 程序 〈 称 之 为 脚本 ) 也 是 以 这 种 格式 存储 的 。 在 随后 
的 章节 中 ， 我 们 将 学 习 如 何 编写 文本 文件 来 修改 系统 设置 ， 并 编写 自己 的 脚本 ， 
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而 现在 我 们 只 需 看 看 它们 的 内 容 即 可 。 


什么 是 文本 

有 很 多 方式 可 在 计算 机 中 表达 信息 。 所 有 的 方式 都 涉及 在 信息 与 一 些 数 
字 之 间 确 立 一 种 关系 ， 而 这 些 数字 可 以 用 来 表达 信息 。 人 毕竟 ， 计 算 机 只 能 理 
解数 字 ， 并 且 所 有 的 数据 都 将 转换 成 数值 来 表示 。 

有 些 表示 方法 非常 复杂 (例如 压缩 后 的 视频 文件 ) 也 有 一 些 其 他 方法 相 
当 简 单 。 其 中 出 现 最 早 也 是 最 简单 的 是 ASCII 文本 。ASCII (发 音 是 “As-Key”) 
是 美国 信息 交换 标准 码 的 简称 。 这 个 简单 的 编码 方案 最 早 用 于 电 传 打 字 机 。 

文本 是 字符 与 数字 之 间 简 单 的 一 对 一 映射 ， 它 非常 紧凑 。 由 50 个 字符 构成 
的 文本 在 转换 为 数据 时 ， 也 是 50 个 字 节 。 这 与 文字 处 理 器 文档 中 的 文本 是 不 一 样 
的 ， 比 如 由 Microsoft Word 或 OpenOffice.org Write 创建 的 文档 。 与 简单 的 ASCII 
文本 相 比 ， 那 些 文件 包含 了 很 多 用 来 描述 结构 和 格式 的 非 文 本 元 素 。 而 普通 的 
ASCIT 文本 文件 仅 包含 字符 本 身 和 一 些 基 本 的 控制 代码 ， 比 如 制 表 符 、 回 车 符 和 
换行 符 。 ， 

纵 观 Linux 系统 ， 很 多 文件 是 以 文本 格式 存储 的 ， 并 且 也 有 很 多 Linux 
工具 来 处 理 文本 文件 。 甚 至 连 Windows 系统 也 认识 到 这 种 格式 的 重要 性 。 众 
所 周知 的 记事 本 程序 就 是 一 款 普通 的 ASCII 文本 文件 编辑 器 。 


less 命令 的 使 用 方式 如 下 。 
less filename 


一 旦 运行 起 来 ,less 程序 允许 我 们 前 后 滚动 文件 。 例 如 ， 想 要 查看 定义 了 系 
统 用 户 账户 的 文件 ， 可 输入 下 面 的 命令 。 


{me@linuxbox -]$ less /etc/passwd 


一 旦 less 程序 运行 起 来 ， 我 们 就 可 查看 文件 内 容 。 如 果 文 件 不 止 一 页 ， 可 
以 上 下 滚动 文件 。 按 Q 键 可 退出 less 程序 。 


表 3-3 列 出 了 less 程序 最 常 使 用 的 键盘 命令 。 


表 3-3 less 命令 
命令 功能 
PAGE UP 或 b 翻 一 


后 翻 一 页 
PAGE DOWN 或 Spacebar 前 翻 一 页 
向 上 第 头 键 向 上 一 行 
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续 表 


0 


命令 功能 


向 下 箭头 键 向 下 一 行 

G 跳 转 到 文本 文件 的 末尾 

1G 或 g 跳 转 到 文本 文件 的 开头 

/charecters 向 前 查找 指定 的 字符 串 

向 前 查找 下 一 个 出 现 的 字符 串 ， 这 个 字符 串 是 之 前 所 指定 查找 的 
h 显示 帮助 屏幕 

q 退出 less 


少 即 是 多 (LESS 1S MORE) 
设计 less 程序 是 为 了 替换 早期 UNIX 中 的 more 程序 。less 这 个 名 字 是 对 短 
语 “less ls more” 开 了 个 玩笑 ， 该 短语 是 现代 派 建筑 师 和 设计 师 们 的 座右铭 。 
”less 命令 属于 “页 面 调度 器 (pagers )” 程 序 类 ， 这 些 程序 允许 通过 一 页 
一 页 的 方式 ， 轻 松 浏 览 很 长 的 文本 文档 。 而 more 程序 只 允许 向 前 翻 页 ， 使 用 
less 命令 既 可 以 前 后 翻 页 ， 还 具有 很 多 其 他 的 特性 。 


3.4 ”快速 浏览 


在 Linux 系统 中 ， 文 件 系 统 布局 与 其 他 类 UNIX 系统 很 相似 。 实 际 上 ， 一 
个 已 经 发 布 的 名 为 Linux 文件 系统 层次 标准 (Linux Filesystem Hierarchy 
Standard) 的 标准 ,已 经 详细 阅 述 了 这 个 设计 。 并 不 是 所 有 Linux ce 
符合 该 标准 ， 但 大 部 分 与 之 很 接近 。 


接 下 来 ， 我 们 将 通过 对 文件 系统 的 探索 来 找到 Linux 系统 正常 运行 所 依赖 
的 基础 。 这 将 提供 一 个 练习 导航 技巧 的 机 会 。 此 时 我 们 会 发 现 ， 很 多 有 趣 的 文 
件 都 是 普通 的 可 读 文本 。 请 尝试 下 面 的 步骤 。 


1. 使 用 cd 命令 进入 一 个 给 定 的 目录 。 

2. 使 用 ls-1 命令 列 出 目录 内 容 。 

3， 如果 看 到 一 个 感 兴趣 的 文件 ， 使 用 file 命令 确定 文件 内 容 。 

4. 如 果 文 件 看 起 来 像 是 一 个 文本 ， 试 着 使 用 less 命令 浏览 其 内 容 。 


牢记 复制 与 粘贴 技巧 ! 如 果 使 用 鼠标 的 话 ， 可 以 双击 文件 名 来 复制 ， 中 键 
单 击 将 其 粘贴 进 命令 行 。 ， 
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当 我 们 浏览 文件 系统 时 ， 不 要 担心 将 文件 系统 的 布局 弄 得 混乱 不 堪 。 普 通 
用 户 不 具有 管理 文件 系统 的 权限 ， 那 是 系统 管理 员 的 工作 ! 如 果 一 条 命令 无 法 
执行 某 些 功能 ， 那 么 继续 选择 其 他 命令 。 多 花 些 时 间 浏 览 一 下 。 系 统 是 需要 大 
家 探索 的 。 记 住 ，Linux 没有 秘密 可 言 。 


表 3-4 只 列 出 了 一 些 探索 到 的 目录 ， 剩余 的 目录 请 大 家 自由 地 探索 ! 
表 3-4 在 Linux 系统 中 找到 的 目录 


内 容 


/boot 


/dev 


letc 


/home 


/iib 


/lost+found 


/media 


/mnt 


/opt 


/proc 


/root 


/sbin 


根 目 录 ， 一 切 从 这 里 开始 

包含 系统 启动 和 运行 所 必需 的 二 进 制 文件 〈 程 序 ) 

包含 Linux 内 核 、 最 初 的 RAM 磁盘 映像 〈 系 统 启动 时 ， 驱 动 程序 会 用 到 )， 以 及 启 
动 加 载 程序 

有 趣 的 文件 : 

。 /boot/grub/grub.conf 或 menu.lst， 用 来 配置 启动 加 载 程序 

e /bootvmlinuz，Linux 内 核 

这 是 一 个 包含 设备 节点 的 特殊 目录 。“ 把 一 切 当 成 文件 ”也 适用 于 设备 。 内 核 将 它 
能 够 识别 的 所 有 设备 存放 在 这 个 目录 里 

/etc 目录 包含 了 所 有 系统 层面 的 配置 文件 ， 同 时 也 包含 了 一 系列 shell 脚本 ， 系 统 每 . 
次 启动 时 , 这 些 sheli 脚本 都 会 打开 每 个 系统 服务 。 该 目录 中 包含 的 内 容 都 应 该 是 可 
读 的 文本 文件 。 

有 趣 的 文件 : 尽管 /etc 目录 中 的 任何 文件 都 很 有 趣 ， 但 这 里 只 列 出 了 一 些 我 一 直 喜 
欢 的 文件 : - 

。 /etc/crontab， 该 文件 定义 了 自动 化 任务 运行 的 时 间 

。 /etc/fstab， 存 储 设备 以 及 相关 挂 载 点 的 列表 

。 /etc/passwd， 用 户 账号 列表 

在 通常 的 配置 中 ， 每 个 用 户 都 会 在 home 目录 中 拥有 一 个 属于 自己 的 目录 。 普 通用 户 
只 能 在 自己 的 主 目录 中 创建 文件 。 这 一 限制 可 以 保护 系统 免 遭 错误 的 用 户 行为 的 破坏 
包含 核心 系统 程序 使 用 的 共享 库 文件 。 这 与 Windows 系统 中 的 DLL 类 似 

每 个 使 用 Linux 文件 系统 的 格式 化 分 区 或 设备 , 例如 ext3 文件 系统 , 都 会 有 这 个 目录 。 
当 文 件 系统 出 演 时 ， 该 目录 用 于 恢复 分 区 。 除 非 系 统 真 的 发 生 很 严重 的 问题 ， 否 则 
这 个 目录 一 直 是 空 的 

在 现代 Linux 系统 中 ，/media 目录 包含 可 移 除 媒体 设备 的 挂 载 点 。 比 如 USB 驱动 、 
CD-ROM 等 。 这 些 设备 在 插入 计算 机 后 ， 会 自动 挂 载 到 这 个 目录 节点 下 

在 早期 的 Linux 系统 中 ，/mnt 目录 包含 手动 挂 载 的 可 移 除 设备 的 挂 接 点 

/opt 目录 用 来 安装 其 他 可 选 的 软件 。 主 要 用 来 存放 可 能 安装 在 系统 中 的 商业 软件 
/proc 目录 很 特殊 。 从 文件 的 角度 来 说 ， 它 不 是 存储 在 硬盘 中 的 真正 的 文件 系统 ， 


反而 是 一 个 Linux 内 核 维 护 的 虚拟 文件 系统 。 它 包含 的 文件 是 内 核 的 窥视 孔 。 该 文 
件 是 可 读 的， 从 中 可 以 看 到 内 核 是 如 何 监管 计算 机 的 


root 账户 的 主 目录 


该 目录 放置 “系统 ”二 进 制 文件 。 这 些 程序 执行 重要 的 系统 任务 ， 这 些 任 务 通常 是 
为 超级 用 户 预 留 的 


20 Linux 命令 行 大 全 


续 表 


内 容 


/usr/bin 


/usr/lib 
/usr/local 


/usr/sbin 


/usr/share 


/usr/share/doc 


/var 


/var/log 


3.5 ”符号 链接 


/tmp 是 供用 户 存放 各 类 程序 创建 的 临时 文件 的 目录 。 某 些 配 置 使 得 每 次 系统 重启 时 
都 会 清空 该 目录 : 

/usr 目录 可 能 是 Linux 系统 中 最 大 的 目录 树 。 它 包含 普通 用 户 使 用 的 所 有 程序 和 相 
关 文 件 


/usr/bin 目录 中 放置 了 一 些 Linux 发 行 版 安装 的 可 执行 程序 。 该 目录 通常 会 存储 成 千 
上 万 个 程序 

/usr/bin 目录 中 的 程序 使 用 的 共享 库 

这 个 /usr/local 目录 是 并 非 系统 发 行 版 自 带 ， 但 却 打算 让 系统 使 用 的 程序 的 安装 目录 。 


由 源 代码 编译 好 的 程序 通常 安装 在 /usr/local/bin 中 。 在 一 个 新 安装 的 Linux 系统 中 ， 
就 存在 这 一 个 目录 ， 但 却 是 空 目 录 ， 直 到 系统 管理 员 向 其 中 添加 内 容 


包含 更 多 的 系统 管理 程序 


/usr/share 目录 里 包含 了 /usrbin 中 的 程序 所 使 用 的 全 部 共享 数据 ， 这 包括 默认 配置 
文件 、 图 标 、 屏 医 背 景 、 音 频 文件 等 


安装 在 系统 中 的 大 部 分 程序 包 包含 一 些 文档 文件 。 在 /usr/share/doc 中 ， 文 档 文件 是 
按照 软件 包 来 组 织 分 类 的 


除了 /tmp 和 /home 目录 之 外 ， 目 前 看 到 的 目录 相对 来 说 都 是 静态 的 ， 也 就 是 说 ， 其 
包含 的 内 容 是 不 变 的 。 而 那些 可 能 改变 的 数据 存储 在 /var 目录 树 里 。 各 种 数据 库 、 
假 脱 机 文件 、 用 户 邮 件 等 都 存储 在 这 里 


/var/log 目录 包含 的 日 志文 件 ， 记 录 了 各 种 系统 活动 。 这 些 文件 非常 重要 ， 并 且 应 该 
时 不 时 地 监控 它们 。 其 中 最 有 用 的 文件 是 /var/iog/messages。 注 意 ， 为 了 安全 起 见 ， 
在 一 些 系统 里 ， 必 须 是 超级 用 户 才 能 查看 日 志文 件 


在 浏览 过 程 中 ， 我 们 可 能 会 看 到 带 有 如 下 条 目的 目录 信息 。 
Jrwxrwxrwx 1 root root 11 2012-08-11 07:34 libc.s0.6 -> libc-2.6.so 


注意 ,该 条 目 信 息 的 第 一 个 字母 是 1， 而且 看 起 来 像 是 有 两 个 文件 名 。 这 种 
特殊 的 文件 叫做 符号 链接 (又 叫 软 链接 或 symlink)。 在 大 多 类 UNIX 系统 中 ， 
一 个 文件 很 可 能 采用 多 个 名 字 来 引用 。 虽 然 这 种 特性 的 意义 并 不 明显 ， 但 是 
它 真 的 很 有 用 。 


想象 这 样 一 个 场景 : 一 个 程序 需要 使 用 包含 在 foo 文件 中 的 一 个 共享 资源 ， 
但 foo 版 本 变化 很 频繁 。 这 样 ， 在 文件 名 中 包含 版 本 号 会 是 一 个 好 主意 ， 因 此 
管理 员 或 其 他 相关 方 就 能 够 看 到 安装 了 foo 的 哪个 版 本 。 这 就 出 现 一 个 问题 。 
如 果 改 变 了 共享 资源 的 名 称 ， 就 必须 跟踪 每 个 可 能 使 用 了 该 共享 资源 的 程序 ， 
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并 且 当 安装 了 该 资源 新 的 版 本 后 ， 都 要 让 使 用 它 的 程序 去 寻找 新 的 资源 名 。 这 
听 起 来 很 没有 意思 。 

下 面 就 是 符号 链接 的 用 武之 处 。 假 设 foo 的 安装 版 本 是 2.6， 它 的 文件 名 是 
foo-2.6， 然 后 创建 一 个 符号 链接 foo 指向 foo-2.6。 这 意味 着 ， 当 一 个 程序 打开 
foo 文件 时 ， 它 实际 上 打开 的 是 文件 foo-2.6， 这 样 一 来 缘 大 欢喜。 依赖 foo 文件 
的 程序 能 够 找到 它 ， 并 且 也 能 看 到 实际 安装 的 版 本 。 当 需要 升级 到 foo-2.7 时 ， 
只 需 将 该 文件 添加 到 系统 里 , 删除 符号 链接 文件 foo, 创建 一 个 指向 新 版 本 的 符 
号 链接 即 可 。 这 不 仅 解决 了 版 本 升级 的 问题 ， 也 可 以 将 两 种 版 本 都 保存 在 机 器 
里 。 假 如 foo-2.7 存在 一 个 程序 错误 〈 都 怪 该 死 的 开发 商 !1)， 需 要 切换 到 有 旧 的 版 
本 。 同 样 ， 只 需 删除 指向 新 版 本 的 符号 链接 ， 重 新 创建 指向 旧版 本 的 符号 链接 
即 可 。 

以 上 列举 的 目录 (来 源 于 Fedora 系统 的 /lib 目录 ) 中 显示 了 一 个 指向 libc-2.6.so 
共享 库 文 件 的 符号 链接 libc.so.6。 也 就 是 说 ， 搜 索 文 件 libc.so.6 的 程序 实际 上 访 
问 的 是 libe-2.6.so 文件 。 下 一 章 我 们 将 学 习 如 何 创建 符号 链接 。 


硬 链接 
既然 在 讨论 链接 问题 ， 就 需要 提 一 下 另 一 种 类 型 的 链接 ， 即 硬 链 接 。 它 
同样 允许 文件 有 多 个 名 字 ， 但 是 处 理 的 方式 是 不 同 的 。 下 一 章 我 们 将 进一步 
讨论 符号 链接 与 硬 链接 的 区 别 。 


第 入 六 


操作 文件 与 目录 


现在 ， 我 们 准备 好 做 些 实际 工作 了 ! 本 章 将 介绍 如 下 命令 。 
cp: 复制 文件 和 目录 。 
。 mv: 移动 或 重 命名 文件 和 目录 。 
。 mkdir: 创建 目录 。 
。 rm: 移 除 文件 和 目录 。 
。 in: 创建 硬 链接 和 符号 链接 。 
这 5 个 命令 属于 最 常 使 用 的 Linux 命令 之 列 ， 可 用 来 操作 文件 与 目录 。 


坦率 地 说 ， 使 用 图 形 文件 管理 器 来 执行 一 些 由 这 些 命令 执行 的 任务 要 容易 得 
多 。 使 用 文件 管理 器 ， 我 们 可 以 将 文件 从 一 个 目录 拖 放 到 另 一 个 目录 ， 我 们 可 以 
剪 切 和 粘贴 文件 ， 我 们 可 以 删除 文件 。 那 么 ， 为 什么 还 要 用 这 些 命令 行程 序 呢 ? 


原因 就 在 于 命令 行程 序 具 有 强大 的 功能 和 灵活 的 操作 。 虽 然 使 用 图 形 文件 
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管理 器 能 轻松 实现 简单 的 文件 操作 ， 但 是 对 于 复杂 的 任务 ， 使 用 命令 行程 序 更 
容易 完成 。 例 如 ， 怎 样 仅 因为 文件 在 目标 目录 中 不 存在 或 存在 旧 的 版 本 ， 就 将 
所 有 HTML 文件 从 一 个 目录 复制 到 目标 目录 里 呢 ? 要 完成 这 个 任务 ， 使 用 文件 
管理 器 则 相当 困难 ， 而 使 用 命令 行 则 很 容易 。 


cp -u *.html destination 


4.1 通配符 


在 开始 使 用 命令 之 前 ， 我 们 需要 介绍 一 个 使 命令 行 如 此 强大 的 shell 特性 。 
由 于 shell 需要 经 常 使 用 文件 名 ， 因 此 它 提供 了 一 些 特殊 字符 来 帮助 你 快速 指定 
一 组 文件 名 。 这 些 特 殊 字符 称 为 通配符 。 通 配 符 ( 也 叫 文 件 名 替换 〉 人 允许 用 户 
依据 字符 模式 选择 文件 名 。 表 4-1 列 出 了 通配符 以 及 它们 所 选择 的 对 象 。 


表 4-1 通配符 

通配符 匹配 项 

. 匹配 任意 多 个 字符 (包括 0 个 和 1 个》 
? 匹配 任 一 单个 字符 不 包括 0 个 ) 
[characters] 匹配 任意 一 个 属于 字符 集中 的 字符 
[!characters] 匹配 任意 一 个 不 属于 字符 集中 的 字符 
[[:class:]] 匹配 任意 一 个 属于 指定 字符 类 中 的 字符 

表 4-2 列 出 了 最 常用 的 字符 类 。 

表 4-2 常用 的 字符 类 
字符 类 匹配 项 

[:alnum:] 匹配 任意 一 个 字母 或 数字 

[:alpha:] 匹配 任意 一 个 字母 

[:digit] 匹配 任意 一 个 数字 

[:lower:] 匹配 任意 一 个 小 写字 母 

[upper:] 匹配 任意 一 个 大 写字 母 


通配符 的 使 用 使 得 为 文件 名 构建 复杂 的 筛选 标准 成 为 可 能 。 表 4-3 列 出 了 


一 些 通配符 模式 及 其 匹配 内 容 的 示例 。 
表 4-3 通配符 示例 
模式 匹配 项 


所 有 文件 
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续 表 
形式 匹配 项 
2* 以 g 开头 的 任 一 文件 
b*.txt 以 b 开头 ， 中 间 有 任意 多 个 字符 ， 并 以 .txt 结尾 的 任 一 文件 
Data??? 以 Data 开头 ， 后 面 跟 3 个 字符 的 任 一 文件 
[abc]* 以 abc 中 的 任 一 个 开头 的 任 一 文件 
BACKUP[0-9][0-9][0-9] 以 BACKUP 开 头 ， 后 面 紧 跟 3 个 数字 的 任 一 文件 
[[:upper:]]* 以 大 写字 母 开 头 的 任 一 文件 
[lf:digit:]]* 不 以 数字 开头 的 任 一 文件 
*[[:lower:]123] 以 小 写字 母 或 数字 1、2、3 中 的 任 一 个 结尾 的 任 一 文件 


通配符 可 以 与 任 一 个 使 用 文件 名 为 参数 的 命令 一 起 使 用 ， 在 第 7 章 我 们 会 
进一步 讨论 。 


字符 范围 
如 果 你 之 前 使 用 过 其 他 的 类 UNIX 环境 或 是 读 过 该 主题 的 相关 书籍 ， 可 
能 遇 到 过 [A-Z] 或 [a-z] 形 式 的 字符 范围 表示 法 。 这 些 都 是 传统 的 UNIX 表示 法 ， 
在 早期 的 Linux 版 本 中 仍然 奏效 。 尽 管 它们 仍然 起 作用 ， 但 使 用 时 请 务必 
小 心 ， 因 为 一 旦 配置 不 当 ， 就 会 产生 非 预 期 的 结果 。 目 前 ， 我 们 要 避免 使 
用 它们 ， 而 是 使 用 字符 类 . 


通配符 在 GUI 中 也 奏效 
通配符 相当 有 用 ， 不 仅仅 因为 它们 在 命令 行 中 使 用 频繁 ,而 且 在 于 一 些 
图 形 文件 管理 器 也 支持 通配符 操作 。 

。 在 Nautilus (GNOME 的 文件 管理 器 ) 中 ， 你 可 以 使 用 Edit->Select 
Pattern 选择 文件 。 仅仅 输入 一 个 用 通配符 表示 的 文件 选择 模式 后 ， 则 
当前 查看 的 目录 中 ， 所 匹配 的 文件 就 会 突出 显示 。 

。 在 Dolphin 和 Konqueror (KDE 的 文件 管理 器 ) 的 一 些 版 本 中 ， 你 可 
以 直接 在 地 址 栏 输 入 通配符 。 比 如 ， 如 果 想 要 在 /usr/bin 目录 中 查找 
所 有 以 小 写字 符 u 开始 的 文件 ， 只 需 在 地 址 栏 输 入 /usr/bin/u*， 即 可 
显示 匹配 的 结果 。 

最 初 源 于 命令 行 界面 的 许多 理念 ， 也 同样 适用 于 图 形 界面 。 而 这 恰恰 是 

使 Linux 系统 桌面 如 此 强大 的 原因 之 一 . 
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4.2 ”mkdir 一 一 创建 目录 
mkdir 命令 是 用 来 创建 目录 的 ， 格 式 如 下 。 


mkdir directory- . 
注意 表示 法 : 本 书 在 描述 命令 时 , 如 果 参 数 后 面 带 有 3 个 点 号 (如 上 所 示 )， 

这 表示 该 参数 重复 。 因 此 ， 下 面 这 种 情况 : 

mkdir dir1 

可 创建 单个 dirl 目录 ， 而 输入 : 

mkdir dirt dir2 dir3 


可 创建 3 个 目录 ， 分 别 命名 为 dir1、dir2 和 dir3 。 


4.3 “cp 一 一 复制 文件 和 目录 
cp 命令 用 来 复制 文件 和 目录 。 它 有 两 种 不 同 的 使 用 方式 ， 如 下 所 示 。 


cp item1 item2 
将 单个 文件 或 目录 iteml 复制 到 文件 或 目录 item2 中 。 


cp item. directory 


将 多 个 项 目 〈 文 件 或 目录 ) 复制 进 一 个 目录 中 。 
表 4-4 和 表 4-5 列 出 了 cp 常用 的 选项 ( 短 选项 和 等 价 的 长 选项 )。 


表 4-4 cp 命令 选项 


选项 含义 
ge 复制 文件 和 目录 及 其 属性 ， 包 括 所 有 权 和 权限 。 通 常 来 说 ， 复 制 的 文 
g 件 具 有 用 户 所 操作 文件 的 默认 属性 

ee 在 覆盖 一 个 已 存在 的 文件 前 ， 提 示 用 户 进行 确认 。 如 果 没 有 指定 该 先 
a Tinieracdve 项 ，cp 会 默认 覆盖 文件 

et 递归 地 复制 目录 及 其 内 容 。 复 制 目录 时 需要 这 个 选项 〈 或 -a 选项 ) 
a 当 将 文件 从 一 个 目录 复制 到 另 一 个 目录 时 ， 只 会 复制 那些 目标 目录 中 
; 不 存在 的 文件 或 是 目标 目录 相应 文件 的 更 新 文件 


-v, --verbose 复制 文件 时 ， 显 示 信 息 性 消息 (informative message) 


表 4-5 cp 命令 示例 
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命令 


结果 


cp filel file2 


cp -ifilel file2 
cp filel file2 dirl 
cp dirl/* dir2 


cp dirl dir2 


将 filel 复制 到 file2。 如 果 file2 存在 ， 则 会 被 flel 的 内 容 镍 盖 。 如 果 
file2 不 存在 ， 则 创建 file2 


同上 ， 区 别 在 于 当 file2 存在 时 ， 六 盖 之 前 通知 用 户 确认 
将 filel 和 file2 复制 到 目录 dirl 里 。dirl 必须 已 经 存在 
通过 使 用 通配符 ， 将 dirl 中 的 所 有 文件 复制 的 dir 中 。dir2 必须 已 经 存在 


将 dirl 目录 (及 其 内 容 ) 复制 到 dir2 目录 中 。 如 果 dir2 不 存在 ， 创 建 
dir2， 且 包含 与 dirl 目录 相同 的 内 容 


mv 一 一 移 除 和 重 命名 文件 


mv 命令 可 以 执行 文件 移动 和 文件 重 命名 操作 ， 这 具体 取决 于 如 何 使 用 它 。 
在 这 两 种 情况 下 ， 完 成 操作 之 后 ， 原 来 的 文件 名 将 不 存在 。mv 的 使 用 方法 与 


cp 基本 相似 。 


mv itemt item2 


将 文件 (或 目录 ) iteml 移动 (或 重 命名 ) 为 item2， 或 是 


mv Item- directory 


将 一 个 或 多 个 条 目 从 一 个 目录 移动 到 另 一 个 目录 下 。 
Imy 命令 很 多 选项 与 cp 命令 是 共享 的 ， 如 表 4-6 和 表 4-7 所 示 。 


表 4-6 myv 选项 
选项 含义 
和 覆盖 一 个 已 存在 的 文件 之 前 ， 提 示 用 户 确认 。 如 果 没 有 指定 该 选项 ， 
~i，--interactive mv 会 默认 获 盖 文件 
二 将 文件 从 一 个 目录 移动 到 另 一 个 目录 ， 只 移动 那些 目标 目录 中 不 存在 
的 文件 或 是 目标 目录 里 相应 文件 的 更 新 文件 
-V，--Verbose 移动 文件 时 显示 信息 性 消息 
表 4-7 myv 示例 
命令 结果 
mv filel file2 将 filel 移 到 fle2。 如 果 file2 存在 ， 则 会 被 filel 的 内 容 牙 盖 。 如 果 file2 
不 存在 ， 则 创建 file2。 无 论 哪 一 种 情况 ，filel 不 再 存在 
mv -i filel file2 同上 ， 仅 当 file2 存在 时 ， 覆 善之 前 通知 用 户 确认 


my filel file2 dirl 


my dirl dir2 


将 flel 和 file2 移 到 目录 dirl 下 。dirl 必须 已 经 存在 


将 目录 dirl (和 其 内 容 ) 移 到 目录 dir2 下 。 如 果 目 录 dir2 不 存在 ， 创 
建 目录 dir2， 将 目录 dirl 的 内 容 移 到 dir2 下 ， 辐 时 删除 目录 dir 
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4.5 rm 一 一 删除 文件 和 目录 
rm 命令 用 来 移 除 〈 删 除 ) 文件 和 目录 ， 如 下 所 示 。 


rm item.. 


其 中 ，item 是 一 个 或 多 个 文件 〈 或 目录 ) 的 名 称 。 


， 小 旋 rm 命令 

类 UNIX 操作 系 统 ( 如 Linux ) 并 不 包含 还 原 删除 操作 的 命令 ， 一 号 使 用 
rm 命令 ， 就 彻底 地 删除 了 。 Linux 系统 默认 用 户 是 明智 的 ， 并 清楚 自 已 在 干 
什么 ， 

rm 命令 二 症 本 从 在 -起 使 用 时 要 特别 小 心 。 1 

0 希望 删除 目录 中 的 HTML 文件 ， 为 此 需要 输入 以 下 正确 的 
rm * -html ， 

如 果 不 小 心 在 * 与 .html 之 间 多 打 了 一 个 空 个 。 各 下 所 看 : 


rm™ .html 


rm 命令 将 会 删除 目 录 中 所 有 文件 ， do 日 上 录 中 没有 中 
做 .html 的 文件 。 
”提示 : 当 rm 命令 与 通配符 一 起 使 用 时 ， 除 仔细 检查 输入 内 容 外 ， 可 使 用 
ls 命令 预先 对 通配符 做 出 测试 ， 这 将 显示 欲 删 除 的 文件 。 紧 接 着 ， 你 可 以 按 
下 向 上 方向 键 调 用 之 前 的 命令 ， 并 使 用 rm 代替 1s。 


表 4-8 和 表 4-9 列 出 了 rm 命令 的 一 些 常用 选项 。 


表 4-8 rm 选项 

选项 信义 ~ | 

i neat 删除 一 个 已 存在 的 文件 前 ， 提 示 用 户 确 认 。 如 果 没 有 指定 这 个 选项 ， 
， rm 命令 会 默认 删除 文件 

re 递归 地 删除 目录 。 也 就 是 说 ， 如 果 删 除 的 目录 有 子 目 录 的 话 ， 也 要 将 
其 删除 。 要 删除 一 个 目录 ， 则 必须 指定 该 选项 

-f，--force 忽略 不 存在 的 文件 并 无 需 提示 确认 。 该 选项 会 覆盖 --interactive 选项 


-V，--Verbose 删除 文件 时 显示 信息 性 消息 
ee a ai 03 I 
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表 4-9 rm 实例 

命令 结果 

rm filel 在 不 提示 用 户 的 情况 下 ， 删 除 filel 

rm -i filel 删除 filel 前 ， 提 示 用 户 确认 

rm -rfilel dirl 删除 flel、dirl 以 及 它们 的 内 容 

rm -rf filel dirl 0 
4.6 ”了 0 一 一 创建 链接 


In 命令 可 用 来 创建 硬 链 接 或 是 符号 链接 。 它 的 使 用 方式 有 两 种 。 
1n file link 
用 来 创建 硬 链接 ， 而 


ln -s item 1link 


用 来 创建 符号 链接 ， 这 里 的 item 可 以 是 文件 也 可 以 是 目录 。 


4.6.1 硬 链 接 

硬 链接 是 最 初 UNIX 用 来 创建 链接 的 方式 , 符号 链接 较 之 更 为 先进 。 默 认 
情况 下 ， 每 个 文件 有 一 个 硬 链 接 ， 该 硬 链接 会 给 文件 起 名 字 。 当 创建 一 个 硬 
链接 的 时 候 ， 也 为 这 个 文件 创建 了 一 个 额外 的 目录 条 目 。 硬 链接 有 两 条 重要 的 
局 限 性 。 
。 硬 链 接 不 能 引用 自身 文件 系统 之 外 的 文件 。 也 就 是 说 ， 链 接 不 能 引用 与 该 

链接 不 在 同一 磁盘 分 区 的 文件 。 
。 硬 链接 无 法 引用 目录 。 

硬 链接 和 文件 本 身 没 有 什么 区 别 。 与 包含 符号 链接 的 目录 列表 不 同 ， 包 含 
硬 链接 的 目录 列表 没有 特别 的 链接 指示 说 明 。 当 硬 链接 被 删除 时 ， 只 是 删除 了 
这 个 链接 ， 但 是 文件 本 身 的 内 容 依然 存在 〈 也 就 是 说 ， 该 空间 没有 释放 )， 除 非 
该 文件 的 所 有 链接 都 被 删除 了 。 

因为 会 经 常 遇 到 它们 ， 了 解 硬 链接 就 显得 特别 重要 。 但 是 现在 大 多 使 用 的 
是 符号 链接 ， 下 面 将 会 有 所 介绍 。 
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4.6.2 ”符号 链接 


符号 链接 是 为 了 克服 硬 链 接 的 局 限 性 而 创建 的 。 符 号 链接 是 通过 创建 一 个 
特殊 类 型 的 文件 来 起 作用 的 ， 该 文件 包含 了 指向 引用 文件 或 目录 的 文本 指针 。 
就 这 点 来 看 ， 符 号 链接 与 Windows 系统 下 的 快捷 方式 非常 相似 ， 但 是 ， 符 号 链 
接 要 早 于 Windows 的 快捷 方式 很 多 年 。 


符号 链接 指向 的 文件 与 符号 链接 自身 几乎 没有 区 别 。 例 如 ， 将 一 些 东 西 写 进 符 
号 链接 里 ， 那 么 这 些 东西 同样 也 写 进 了 引用 文件 。 而 当 删 除 一 个 符号 链接 时 ， 删 除 
的 只 是 符号 链接 而 没有 删除 文件 本 身 。 如 果 先 于 符号 链接 之 前 删除 文件 ,那么 这 个 
链接 依然 存在 ， 但 却 不 指向 任何 文件 。 此 时 ， 这 个 链接 就 称 为 坏 链 接 。 在 很 多 实现 
中 ，ls 命令 会 用 不 同 的 颜色 来 显示 坏 链接 ， 比 如 红色 ， 从 而 显示 它们 的 存在 。 


链接 的 概念 似乎 很 令 人 迷惑 ， 但 是 不 要 害怕 。 我 们 要 经 常 性 地 使 用 ， 它 们 
慢 慢 的 就 会 清晰 起 来 。 


4.7 ”实战 演练 


由 于 我 们 要 做 一 些 实际 的 文件 操作 ， 我 们 先 来 创建 一 个 安全 的 地 带 ， 来 执 
行文 件 操作 命令 。 首 先 ， 我 们 需要 一 个 工作 目录 。 我 们 在 主 目录 里 创建 一 个 目 
录 并 命名 为 playground。 


4.7.1 创建 目录 


mkdir 命令 用 来 创建 一 个 目录 。 为 了 创建 playground 目录 , 我 们 首先 要 保证 
当前 目录 是 主 目 录 ， 然 后 再 创建 新 目录 。 


[me@linuxbox ~]$ cd 
[me@linuxbox ~]$ mkdir playground 


为 了 让 我 们 的 实战 演练 更 有 意思 ， 我 们 在 playground 目录 中 新 建 两 个 目录 ， 命 
名 为 dtr1、dir2。 为 此 ， 我们 应 先 将 当前 的 工作 目录 切换 为 playground， 然 后 再 次 执 
行 mkdir 命令 。 


[me@linuxbox ~]$ cd playground 
[meelinuxbox playground]$ mkdir dirt dir2 


需要 注意 的 是 ，mkdir 命令 可 以 接受 多 个 参数 ， 从 而 允许 我 们 用 一 个 命令 创 
建 两 个 目录 。 . 
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4.7.2 ”复制 文件 
接 下 来 ， 让 我 们 在 创建 的 目录 中 放 入 一 些 数据 。 这 一 过 程 可 通过 文件 复制 来 完 
成 。 通 过 使 用 cp 命令 ， 我 们 可 以 将 /ect 目录 中 的 passwd 文件 复制 到 当前 工作 目录 里 。 


[meelinuxbox playground]$ cp /etc/passwd . 


注意 我 们 是 如 何 使 用 当前 工作 目录 的 快捷 方式 的 ， 即 在 命令 末尾 加 单个 名 
点 。 如 果 我 们 此 时 执行 js 命令 ， 将 会 看 到 我 们 的 文件 。 


[me@iinuxbox playground]$ 1s -1 

total 12 

drwxrwxr-x 2 me me 4096 2012-01-10 16:40 dir1 
drwxrwxr-x 2 me me 4096 2012-01-10 16:40 dir2 
-rw-r--r-- 1 me me 1650 2012-01-10 16:07 passwd 


现在 让 我 们 使 用 -v 选项 ， 重 复 操作 复制 命令 ， 来 看 看 结果 如 何 。 


[me@linuxbox piayground]$ cp -v /etc/passwd . 
'/etc/passwd' -> './passwd' 


cp 命令 再 次 执行 复制 操作 ， 但 是 ， 这 一 次 显示 了 一 条 简洁 的 信息 来 指明 它 
正在 执行 什么 操作 。 需 要 注意 的 是 ， 在 没有 任何 警告 的 情况 下 ，cp 命令 覆盖 了 
第 一 次 的 复制 内 容 。cp 命令 会 假定 用 户 清楚 自己 当前 的 操作 。 加 上 -i 交互 式 ) 
选项 可 以 获得 警告 信息 。 


[me@linuxbox playground]$ cp -i /etc/passwd . 
cp: overwrite './passwd'? 


通过 在 提示 符 下 输入 y， 文 件 就 会 被 重 写 ， 任 何其 他 的 字符 《比如 ，n) 会 
使 cp 命令 保留 该 文件 。 


4.7.3 ”移动 和 重 命 名 文件 


现在 ，passwd 这 个 名 字 似 乎 没有 那么 有 趣 ， 而 我 们 毕竟 是 在 进行 实战 演练 ， 
因此 我 们 给 它 改 个 名 字 。 


fmeelinuxbox playground]$ mv passwd fun 


现在 传送 fun 文件， 这 是 通过 将 重 命名 的 文件 移动 到 各 个 目录 ， 然 后 再 移 
动 回 当前 目录 来 实现 的 : 


[me@linuxbox playground]$ mv fun dir1 


首先 移 到 目录 dirl 下 ， 然 后 : 
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[me@linuxbox playground]$ mv dir1/fun dir2 
将 文件 从 目录 dirl 移 到 dir2， 然 后 : 


[meelinuxbox playground]$ mv dir2/fun . 


再 将 文件 fun 重新 移 到 当前 工作 目录 下 。 下 面 来 看 mv 命令 的 效果 。 首先 ， 
再 次 将 数据 文件 移 到 目录 diri。 


[me@linuxbox playground]$ mv fun diri 


然后 将 目录 dirl 移 到 dir2 并 且 使 用 ls 命令 进行 确认 。 


{me@linuxbox playground]$ mv dir1 dir2 
[Ime@linuxbox playground]$ ls -1 dir2 


total 4 


drwxrwxr-x 2 me me 4096 2012-01-11 06:06 diri 
[me@linuxbox playground]$ ls -1 dir2/dir1 


total 4 


-PW-r--r-- 1 me me 1650 2012-01-10 16:33 fun 


注意 ， 因为 目录 dir2 已 经 存在 ，mv 命令 将 目录 dirl 移 到 dir2。 如 果 dir2 
不 存在 ，mv 将 dirl 重 命 名 为 dir2。 最 后 ， 我 们 将 所 有 东西 放 回 原 处 。 


[me@linuxbox playground]$ mv dir2/dir1 . 
[meelinuxbox playground]$ mv diri/fun . 


4.7.4 创建 硬 链接 


现在 ， 我 们 试 着 创建 一 些 链接 。 首先 是 创建 硬 链 接 ， 我 们 先 按照 如 下 方式 
创建 一 些 指向 数据 文件 的 链接 : 


[me@linuxbox playground]$ ln fun fun-hard 
[me@linuxbox playground]$ ln fun diri1/fun-hard 
[me@linuxbox playground]$ ln fun dir2/fun-hard 


目前 有 4 个 文件 fun 的 实例 。 来 看 一 下 playground 目录 。 


[me@linuxbox playgroundi$ ls -1 


total 16 

drwxrwxr-x 2 me 
drwxrwxr-x 2 me 
-MW-r--r-- 4 me 
-MW-r--r-- 4 me 


me 
me 
me 
me 


4096 2012-01- 
4096 2012-01- 
1650 2012-01- 
-10 16:33 fun-hard 


1650 2012-01 


14 16:17 diril 
14 16:17 dir2 
10 16:33 fun 


可 以 注意 到 ， 在 列表 中 ， 文件 fun 和 fun-hard 的 第 二 个 字段 都 是 4， 这 是 文 


件 fun 存在 的 硬 链接 数目 。 


你 要 记得 ， 由 于 文件 名 是 由 链接 创建 的 ， 所 以 一 个 


文件 通常 至 少 有 一 个 链接 。 那 么 ， 我 们 是 如 何 知道 fan 和 fun-hard 实际 上 是 同 
一 个 文件 的 呢 ? 这 种 情况 下 ，1s 命令 无 济 于 事 。 虽 然 从 第 5 个 字段 得 知 fun 和 
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fun-hard 文件 大 小 相同 , 但 是 我 们 的 列表 并 没有 提供 可 靠 的 方式 来 确认 它们 是 否 
是 同一 个 文件 。 要 解决 这 个 问题 ， 必 须 做 进一步 研究 。 


提 到 硬 链接 时 ， 可 以 想象 文件 是 由 两 部 分 组 成 的 ， 即 包含 文件 内 容 的 数据 
部 分 和 包含 文件 名 的 名 称 部 分 。 创 建 硬 链接 时 ， 实 际 上 是 创建 了 额外 的 名 称 ， 
这 些 名 称 都 指向 同一 数据 部 分 。 系 统 分 配 了 一 系列 的 盘 块 给 所 谓 的 索引 节点 
Cinode)， 该 节点 随后 与 文件 名 称 部 分 建立 关联 。 因 此 ， 每 个 硬 链 接 都 指向 包含 
文件 内 容 的 具体 索引 节点 。 


ls 命令 有 一 种 方式 可 以 显示 上 述 信息 。 它 是 通过 在 命令 中 加 上 -i 选项 来 实 
现 的 。 


[me@linuxbox piayground]}$ ls -11 

total 16 

12353539 drwxrwxr-x 2 me me 4096 2012-01-14 16:17 dir1 
12353540 drwxrwxr-x 2 me me 4096 2012-01-14 16:17 dir2 
12353538 -rw-r--r-- 4 me me 1650 2012-01-10 16:33 fun 
12353538 -rw-r--r-- 4 me me 1650 2012-01-10 16:33 fun-hard 


在 这 个 列表 中 ， 第 一 个 字段 就 是 索引 节点 号 ， 可 以 看 到 ，fun 和 fun-hard 共 
享 同一 个 索引 节点 号 ， 这 就 证 实 它们 是 相同 的 文件 。 


4.7.5 ”创建 符号 链接 


只 所 以 创建 符号 链接 ， 是 为 了 克服 硬 链接 的 两 大 不 足 ， 即 硬 链接 无 法 跨越 
物理 设备 ， 也 无 法 引用 目录 ， 只 能 引用 文件 。 符 号 链接 是 一 种 特殊 类 型 的 文件 ， 
它 包 含 了 指向 目标 文件 或 目录 的 文本 指针 。 


创建 符号 链接 与 创建 硬 链 接 相 似 ， 如 下 所 示 。 


[me@linuxbox playground]$ ln -s fun fun-sym 
Ime@linuxbox playground]$ ln -s ../fun diri/fun-synm 
[me@linuxbox playground]$ ln -8s ../fun dir2/fun-sym 


第 一 个 命令 相当 直接 ， 我 们 只 是 在 In 命令 中 添加 -s 选项 ， 就 可 以 创建 符号 
链接 而 不 是 硬 链接 。 但 是 ， 接 下 来 的 两 个 命令 是 干什么 的 呢 ? 牢记 一 点 ， 创 建 
符号 链接 时 , 同时 也 创建 一 个 文本 来 描述 目标 文件 在 哪里 与 与 符号 链接 有 关联 。 
如 果 看 看 ls 命令 的 输出 就 更 容易 明白 了 。 


[me@linuxbox playground]$ ls -1 dir1 


total 4 
-rw-r--r-- 4 me me 1650 2012-01-10 16:33 fun-hard 
lrwxrwxrwx 1 me me 6 2012-01-15 15:17 fun-sym -> ../fun 


在 目录 dirl 中 ，fun-sym 的 列表 显示 它 是 一 个 符号 链接 ， 这 是 通过 第 1 个 
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字段 中 的 首 字符 “1” 来 确认 的 ， 并 且 它 也 指 “../fun”， 这 也 是 正确 的 。 相 对 于 
fun-sym 的 实际 位 置 ， 文 件 fan 在 它 的 上 一 级 目录 。 还 要 注意 到 ， 符 号 链接 文 
件 的 长 度 是 6， 这 是 “..fun” 字符 串 中 字符 的 数目 ， 而 不 是 它 所 指向 的 文件 的 
长 度 。 

创建 符号 链接 时 ， 可 以 使 用 绝对 路 径 名 ， 如 下 所 示 : 
[me@linuxbox playground]$ ln -s /home/me/playground/fun diri/fun-sym 


也 可 以 使 用 相对 路 径 ， 如 前 面 的 示例 所 示 。 因 为 相对 路 径 允 许 包含 符号 
链接 的 目录 被 重 命名 和 /或 移动 ， 而 且 不 会 破坏 链接 ， 因 此 更 可 取 一 些 。 


除了 普通 文件 之 外 ， 符 号 链接 也 可 以 引用 目录 。 


[meelinuxbox playground]$ ln -S dir1 diri-sy® 

[meelinuxbox playground]$ 1s -1 

total 16 

drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir1 

Jrwxrwxrwx 1 me me 4 2012-01-16 14:45 dirt-sym -> diri 
drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir2 

-rw-r--r-- 4 me me 1650 2012-01-10 16:33 fun 

-rw-r--r-- 4 me me 1650 2012-01-10 16:33 fun-hard 
Jrwxrwxrwx 1 me me 3 2012-01-15 15:15 fun-sym -> fun 


4.7.6” 移 除 文件 和 目录 


前 面 讲 到 ， 使 用 rm 命令 可 以 删除 文件 和 目录 。 那 么 我 们 就 用 它 来 清空 
playground 目录 。 首 先 ， 我 们 删除 目录 中 的 一 个 硬 链 接 。 


{me@linuxbox playground]$ rm fun-hard 
[me@linuxbox plLayground]$ ls -1 


total 12 
drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir1 
lrwxrwxrwx 1 me me 4 2012-01-16 14:45 dir1-sSym -> diri 


drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir2 
-rw-r--r-- 3 me me 1650 2012-01-10 16:33 fun 
Jrwxrwxrwx 1 me me 3 2012-01-15 15:15 fun-sym -> fun 


不 出 所 料 , 文件 file-hard 被 删除 了 , 文件 fun 的 链接 数 相应 的 也 由 4 变 成 了 
3， 如 目录 列表 的 第 二 个 字段 所 示 。 接 下 来 ， 我 们 删除 文件 fun， 为 了 好 玩 ， 我 
们 还 会 加 上 -i 选项 ， 看 看 执行 了 哪些 操作 。 
[me@linuxbox playground]$ rm -1 fun 
rm: remove regular file 'fun'? 

在 提示 符 下 输入 字符 y， 文 件 就 被 删除 了 。 现 在 看 一 下 ls 命令 的 输出 。 注 
意 fin-sym 文件 发 生 了 什么 变化 ? 由 于 它 是 一 个 符号 链接 , 且 指 向 的 文件 现在 已 
经 不 存在 ， 所 以 链接 也 就 破坏 了 。 
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{me@linuxbox playground]$ ls -1 


total 8 

drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir1 

lrwxrwxrwx 1 me me 4 2012-01-16 14:45 diri-sym -> diri 
drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir2 

lrwxrwxrwx 1 me me 3 2012-01-15 15:15 fun-sym -> fun 


大 多 数 Linux 发 行 版 会 配置 ls 命令 , 来 显示 破坏 的 链接 。 在 Fedora 系统 中 ， 
破坏 的 链接 是 以 闪烁 的 红色 来 显示 的 ! 受 破坏 的 链接 并 不 危险 ， 但 是 会 相当 混 
乱 麻 烦 。 如 果 试 图 调用 破坏 的 链接 ， 将 会 看 到 如 下 情况 : 


[me@linuxbox playground]$ less fun-syn 
fun-sym: No such file or directory 


稍微 清理 一 下 。 我 们 准备 删除 符号 链接 。 


[meelinuxbox playground]$ rm fun-sym dirt-syw 
[me@linuxbox playground]j$ 1s -1 

total 8 

drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir1 
drwxrwxr-x 2 me me 4096 2012-01-15 15:17 dir2 


有 关 符 号 链接 ， 需 要 记 住 一 点 ， 即 大 部 分 文件 操作 是 以 链接 目标 为 对 象 的 ， 
而 非 链接 本 身 。 而 rm 命令 是 个 例外 。 当 删除 一 个 链接 的 时 候 , 链接 本 身 被 删除 ， 
但 是 目标 文件 依旧 存在 。 


最 后 ， 我 们 需要 删除 目录 playground。 为 此 ， 我 们 将 返回 主 目录 ， 使 用 rm 
命令 的 递归 选项 〈-r) 来 删除 playground 目录 以 及 包括 子 目录 在 内 的 所 有 内 容 。 


[me@linuxbox playground]$ cd 
[meelinuxbox ~]$ rm -r playground 


使 用 GUI 创建 符号 链接 
”GNOME 和 KDE 中 的 文件 管理 器 提供 了 一 种 自动 创建 符号 链接 的 简单 
方法 。 在 GNOME 环境 下 ， 拖 搜 文件 时 同时 按 住 Ctrl-Shift 键 将 会 新 建 链接 
文件 ， 而 不 是 执行 复制 (移动 ) 操作。 在 KDE 环境 下 ， 无 论 什么 时 候 放下 
( drop ) 一 个 文件 都 会 弹出 一 个 小 菜单 ， 它 提供 了 复制 、 移 动 或 创建 链接 文 
件 等 选项 。 


4.8 本 章 结尾 语 


到 此 为 止 ， 我 们 已 经 学 习 了 大 量 的 基础 知识 ， 可 能 要 花 一 段 时 间 来 完全 消 
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化 吸收 。 我 们 要 反复 地 操作 playground 实例 ， 直 到 完全 掌握 。 其 中 ， 能 够 很 好 
地 理解 基本 的 文件 操作 命令 和 通配符 是 很 重要 的 。 我 们 可 以 通过 增加 文件 和 目 
录 来 自由 地 拓展 playground 实例 ， 使 用 通配符 来 指明 各 种 操作 需要 的 文件 。 刚 
开始 的 时 候 ， 链 接 的 概念 可 能 有 些 模糊 ， 但 在 花 些 时 间 学 习 之 后 ， 我 们 就 会 发 
现 它 真 的 是 大 有 神 益 。 


第 章 
命令 的 使 用 


到 此 为 止 ， 我 们 已 经 学 习 了 多 个 神秘 的 命令 ， 而 且 每 个 命令 带 有 神秘 的 选 
项 和 参数 。 在 本 章 中， 我们 将 进一步 揭 开 命令 的 神秘 面纱 ， 甚 至 尝试 创建 自己 
的 命令 。 本 章 中 介绍 的 命令 如 下 。 


。 type: 说 明 如 何 解释 命令 名 。 

。 which: 显示 会 执行 哪些 可 执行 程序 。 
。 man: 显示 命令 的 手册 页 。 

。 apropos: 显示 一 系列 合适 的 命令 。 

。 info: 显示 命令 的 info 条 目 。 

。 whatis: 显示 一 条 命令 的 简 述 。 

。 alias: 创建 一 条 命令 的 别名 。 
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5.1 ”究竟 什么 是 命令 


一 条 命令 不 外 乎 以 下 4 种 情况 。 

。 可 执行 程序 。 可 执行 程序 就 像 在 /usr/bin 目录 里 看 到 的 所 有 文件 一 样 。 在 该 
程序 类 别 中 ， 程 序 可 以 编译 为 二 进 制 文件 ， 比 如 C、C++ 语 言 编写 的 程序 ， 
也 可 以 是 shell、Perl、Python、Ruby 等 脚本 语言 编写 的 程序 。 


。 shell 内 置 命令 .bash 支持 许多 在 内 部 称 之 为 shell builtin 的 内 置 命 令 。 例 如 ， 
cd 命令 就 是 shell 内 置 指令 。 


。 shell 函数 。shell 函数 是 合并 到 环境 变量 中 的 小 型 shell 脚本 。 在 后 面 的 章 
节 中 ， 我 们 将 讨论 环境 变量 的 配置 以 及 shell 函数 的 编号， 但 是 目前 我 们 只 
需 知道 它们 的 存在 就 好 了 。 


。 alias 命令 。 我 们 可 以 在 其 他 命令 的 基础 上 定义 自己 的 命令 。 


5.2 ”识别 命令 


能 够 准确 地 识别 我 们 使 用 的 命令 是 上 述 4 种 命令 类 型 中 的 哪 一 种 是 很 有 用 
的 。 为 此 ，Linux 提供 了 两 个 方法 来 识别 命令 类 型 。 


5.2.1 type 一 一 显示 命令 的 类 型 


type 命令 是 一 个 shell 内 置 命令 ， 可 根据 指定 的 命令 名 显示 shell 将 要 执行 的 
命令 类 型 。 格 式 如 下 。 


type command 
这 里 的 command 是 想 要 查看 的 命令 名 。 一 些 实例 如 下 所 示 。 


[me@linuxbox ~]1$ type type 

type is a shell builtin 
[me@linuxbox ~]$ type 1s 

ls is aliased to 'ls --color=tty' 
[meelinuxbox ~]$ type cp 

cp is /bin/cp 


这 里 将 看 到 3 种 不 同 命令 的 查看 结果 。 需要 注意 的 是 , 1s 命令 (来自 Fedora 
系统 ) 实际 上 是 带 有 --color=tty 选项 的 ls 命令 的 别名 。 现 在 我 们 知道 了 ls 命令 
的 输出 为 什么 会 有 颜色 了 。 
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5.2.2 which 显示 可 执行 程序 的 位 置 


有 了 时候， 系统 中 可 能 会 安装 了 一 个 可 执行 程序 的 多 个 版 本 。 这 种 现象 虽然 
在 桌面 系统 中 不 常见 ， 但 是 在 大 型 服务 器 中 却 是 很 常见 的 。 使 用 which 命令 可 
以 确定 一 个 给 定 可 执行 文件 的 准确 位 置 。 
[me@linuxbox ~]$ which 1s 
/bin/1ls 

which 命令 只 适用 于 可 执行 程序 , 而 不 适用 于 内 置 命令 和 命令 别名 (真正 可 
执行 程序 的 替代 物 )。 试 图 在 shell 内 置 命令 〈 例 如 ，cd) 中 使 用 which 命令 时 ， 
要 么 没有 响应 ， 要 么 得 到 一 条 错误 信息 : 


[meelinuxbox ~]$ which cd 


/usr/bin/which: no cd in (/opt/jre1.6.0 03/bin:/usr/lib/qt-3.3/bin:/usr/kerber 
osy/bin:/opt/jre1.6.0 03/bin: /usr/lib/ccache: /usr/local/bin: /usr/bin: /bin: /home 
/me/bin) 


which 命令 是 一 种 是 “无 法 找到 命令 ”的 奇特 方式 。 


5.3 ”获得 命令 文档 
了 解 了 什么 是 命令 后 ， 我 们 可 以 查看 每 一 类 命令 的 可 用 文档 。 


5.3.1 help 一 获得 shell 内 置 命令 的 帮助 文档 


bash 为 每 一 个 shell 内 置 命 令 提供 了 一 个 内 置 的 帮助 工具 。 输 入 help， 然 后 
输入 shell 内 置 命令 的 名 称 即 可 使 用 该 帮助 工具 。 例 如 : 


[me@linuxbox ~]$ help cd 

cd: cd [-L|-P] [dir] 

Change the current directory to DIR. The variable $HOME is the default DIR. 
The variable CDPATH defines the search path for the directory containing DIR. 
Alternative directory names in CDPATH are separated by a colon (:). A null 
directory name is the same as the current directory, i.e. '.'. If DIR begins 
with a slash (/)}, then CDPATH is not used. If the directory is not found, and 
the shell option 'cdable vars' is set, then try the word as a variable name. 
If that variable has a value, then cd to the value of that variable. The -P 
option says to use the physical directory structure instead of following 
symbolic links; the -L option forces symbolic links to be followed. 


注意 表示 法 : 出 现在 命令 语法 描述 中 的 方 括号 表示 一 个 可 选 的 选项 。 竖 线 
符号 代表 的 是 两 个 互 斥 的 选项 。 比 如 上 边 的 cd 命令 : cd [-L|-P] [dir]。 


这 种 表示 法 说 明 ，ed 命令 后 可 能 有 一 个 -L 参数 ， 也 可 能 是 -P 参数 ， 甚 至 可 以 跟 
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参数 dir。 

尽管 cd 命令 的 帮助 文档 简明 而 又 准确 ， 但 这 绝 不 是 一 个 辅导 教程 ， 我 们 所 
可 以 看 到 ， 帮 助 文档 中 也 似乎 提 到 了 很 多 我 们 还 没有 讨论 到 的 内 容 ! 别 担心 ， 
稍 后 我 们 会 详 加 说 明 。 


5.3.2 ”help 一 一 显示 命令 的 使 用 信息 


很 多 可 执行 程序 都 支持 -help 选项 ，--help 选项 描述 了 命令 支持 的 语法 和 
选项 。 例 如 : 
[me@linuxbox ~]$ mkdir --help 


Usage: mkdir [OPTION] DIRECTORY... 
Create the DIRECTORY(ies), if they do not already exist. 


-Z, --Ccontext=CONTEXT (SELinux) Set security context to CONTEXT 
Mandatory arguments to long options are mandatory for short options too. 


-m，- -mode=MODE set file mode (as in chmod), not a=rwx — Unmask 
-pP，--parents no efrror if existing, make parent directories as 
needed 
-Vv, --Vverbose print a message for each created directory 
--help display this help and exit 


~-version output version information and exit 
Report bugs to <bug-coreutils@gnu.org>. 


一 些 程序 不 支持 --help 选项 , 但 是 我 们 还 是 要 试 试 。 这 通常 会 产生 一 条 错误 
消息 ， 该 错误 消息 也 能 揭示 相同 的 命令 使 用 信息 。 


显示 程序 的 手册 页 


大 多 数 供 命令 行使 用 的 可 执行 文件 ， 提 供 一 个 称 之 为 manual 或 者 是 man page 
的 正式 文档 。 该 文档 可 以 用 一 种 称 为 man 的 特殊 分 页 程序 来 查看 ， 用 法 如 下 。 
man program 

这 里 的 program 是 需要 查看 的 命令 名 称 。 

手册 文档 在 格式 上 会 有 所 不 同 ， 但 是 通常 都 包括 标题 、 命 令 句 法 的 摘要 、 
命令 用 途 的 描述 、 命 令 选 项 列表 以 及 每 个 命令 选项 的 描述 。 但 是 ， 手 册 文 档 通 
常 不 包括 实例 , 更 多 的 是 作为 一 个 参考 使 用 , 而 不 是 教程 。 例 如 , 尝试 查看 ls 命 
令 的 手册 文档 。 


[me@linuxbox ~]$ man ls 


在 大 多 数 Linux 系统 中 ，man 命令 调用 less 命令 来 显示 手册 文档 。 所 以 ， 
当 显 示 手 册 文 档 时 ， 你 熟悉 的 所 有 less 命令 都 能 奏效 。 


5.3.3 man 
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man 命令 显示 的 “手册 文档 ”被 分 成 多 个 部 分 (section)， 它 不 仅 包 括 用 户 命 
令 ， 也 包括 系统 管理 命令 、 程 序 接口 、 文 件 格式 等 。 表 5-1 描述 了 手册 文档 的 结 


构 安 排 。 

表 5-1 手册 文档 的 组 织 结构 

部 分 内 容 

1 用 户 命令 

2 内 核 系统 调用 的 程序 接口 

3 C 库 函数 程序 接口 

4 特殊 文件 ， 如 设备 节点 和 驱动 程序 
5 文件 格式 

6 游戏 和 娱乐 ， 例 如 屏幕 保护 程序 
7 其 他 杂项 

8 系统 管理 命令 


有 时 候 我 们 需要 查看 手册 文档 的 具体 部 分 ， 以 查找 我 们 需要 的 信息 。 当 我 
们 所 查找 的 一 个 文件 格式 同时 也 是 一 个 命令 名 的 时 候 , 这 一 点 就 尤为 重要 了 。 如果 
没有 指明 部 分 编号 (section number)， 通 常 我 们 会 获得 第 一 次 匹配 的 实例 〈 它 可 能 
会 出 现在 第 一 部 分 )。 为 了 指明 具体 在 哪个 部 分 ， 我 们 可 以 这 样 使 用 man 命令 。 


man section search term 
例如 : 
[me@linuxbox ~]$ man 5 passwd 


该 命令 将 会 显示 文件 /etc/passwd 的 文件 格式 描述 手册 。 


显示 合适 的 命令 

我 们 有 可 能 会 搜索 参考 手册 列表 ， 才 进行 基于 某 个 搜索 条 目的 匹配 。 尽 管 
有 些 粗 糙 ， 但 是 这 种 方法 有 时 还 是 很 有 用 的 。 下 面 是 一 个 使 用 floppy 为 搜索 条 
目 ， 来 搜索 参考 手册 的 例子 。 


[me@linuxbox ~]$ apropos floppy 
create_floppy_devices (8) - udev callout to create all possible 


5.3.4 apropos 


floppy device based on the CMOS type 


fdformat (8) - Low-level formats a floppy disk 

floppy (8) - format floppy disks 

gfloppy {1) - a simple floppy formatter for the GNOME 

mbadblocks (1) - tests a floppy disk, and marks the bad 
blocks in the FAT 

mformat (1) - add an MSDOS filesystem to a low-level 


formatted floppy disk 
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在 输出 中 ， 每 一 行 的 第 一 个 字段 是 手册 页 的 名 称 ， 第 二 个 字段 显示 部 分 
(section)。 注 意 ， 带 有 -k 选项 的 man 命令 与 apropos 命令 在 功能 上 基本 是 一 致 的 。 


5.3.5 ”whatis 一 一 显示 命令 的 简要 描述 ; 
whatis 程序 显示 匹配 具体 关键 字 的 手册 页 的 名 字 和 一 行 描述 。 


[me@linuxbox ~]$ whatis ls 


1s (1) - list directory contents 
最 难以 忍受 的 参考 手册 


我 们 已 经 看 到 ，Linux 和 其 他 类 UNIX 系统 中 的 手册 文档 是 作为 参考 文档 
而 非 教程 来 使 用 的 。 很 多 手册 文档 都 难以 阅读 ， 其 中 bash 提供 的 手册 页 最 为 
困难 。 在 本 书 的 编写 过 程 中 ， 我 仔细 复查 ， 以 确保 覆盖 了 手册 文档 中 的 大 部 
分 主题 。 如 果 打 印 出 来 的 话 ， 将 超过 80 页， 而且 排版 非常 紧凑 ， 对 一 个 初学 
者 而 言 ， 这 种 结构 是 毫 无 意义 的 。 

另 一 方面 ，bash 手册 文档 非常 准确 ， 也 非常 简要 ， 同 时 也 相当 完备 。 所 
以 ， 如 果 有 胆量 就 去 尝试 一 下 ， 并 期 待 有 一 天 能 读 懂 它 。 


5.3.6 ”info 一 一 显示 程序 的 info 条 目 


GNU 项 目 提供 了 info 页 面 来 代替 手册 文档 。info 页 面 可 通过 info 阅读 器 来 
显示 。info 页 面 使 用 超 链 接 ， 这 与 网 页 结构 很 相似 。 实 例如 下 。 


File: coreutils.info, Node: 1LS invocation, Next: dir invocation, Up: 
Directory listing 


10.1 'ls': List directory contents 


The '1s' program lists information about files (of any type, including 
directories). Options and file arguments can be intermixed arbitrarily, as 
usual. 


For non-option command-line arguments that are directories, by default '1s' 
lists the contents of directories, not recursively, and omitting files with 
names beginning with '.'. For other non-option arguments, by default ']s' 
lists just the filename. If no non-option argument is specified, '1ls' operates 
on the current directory, acting as if it had been invoked with a single 
argument of ’'.! 


By default, the output is sorted alphabetically, according to the 
--zz-Info: (coreutils.info.gz)ls invocation, 63 lines --Top---------- 


第 5 章 命令 的 使 用 43 


info 程序 读 取 info 文件 ， 该 文件 是 树 形 结构 ， 分 为 各 个 单独 的 节点 ， 每 一 
个 节点 包含 一 个 主题 。info 文件 包含 的 超 链接 可 以 实现 节点 间 的 跳 转 。 通 过 前 置 
星 号 可 以 识别 超 链接 ， 将 光标 放 在 超 链 接 上 并 按 Enter 键 ， 可 以 激活 它 。 


可 以 通过 输入 info 以 及 程序 名 〈 可 选 的 ) 来 调用 info。 表 5-2 列 出 了 显示 
info 页 面 时 ， 用 于 控制 阅读 器 的 命令 。 


表 5-2 info 命令 
命令 功能 
? 显示 命令 帮助 
PAGE UP or BACKSPACE 返回 上 一 页 
PAGE DOWN or Spacebar 翻 到 下 一 页 
n Next 显示 下 一 个 节点 
p Previous 一 一 显示 上 一 个 节点 
u Up 一 一 显示 目前 显示 节点 的 父 节点 (通常 是 一 个 菜单 》 
ENTER 进入 光标 所 指 的 超 链接 
q 退出 


到 目前 为 止 , 我 们 讨论 的 大 部 分 命令 行程 序 都 是 GNU 项 目 coreutils 包 的 一 
部 分 ， 输 入 以 下 内 容 可 以 看 到 更 多 的 信息 。 
[me@linuxbox -~-]$ info coreutils 


我 们 将 会 看 到 一 个 菜单 页 面 ， 该 菜单 页 面包 含 了 coreutils 包 提供 的 每 个 程序 
的 文档 的 超 链 接 。 


5.3.7 README 和 其 他 程序 文档 文件 


系统 中 安装 的 很 多 软件 包 都 有 自己 的 文档 文件 , 它们 存放 在 /usr/share/doc 目录 
中 。 其 中 大 部 分 文档 文件 是 以 纯 文本 格式 存储 的 ， 因 此 可 以 用 less 命令 来 查看 。 
有 些 文件 是 HTML 格式 ， 并 且 可 以 用 Web 浏览 器 来 查看 。 我 们 可 能 会 遇 到 一 
些 以 .gz 扩展 名 结尾 的 文件 。 这 表明 它们 是 使 用 gzip 压缩 程序 压缩 过 的 。gzip 
包 包 含 一 个 特殊 的 less 版 本 ， 称 之 为 zless。zless 可 以 显示 由 gzip 压缩 的 文本 文 
件 的 内 容 。 


5.4 使 用 别名 创建 自己 的 命令 


现在 我 们 可 以 尝试 编写 程序 了 ! 我 们 可 以 使 用 alias 命令 来 创建 自己 的 命令 。 
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但 是 在 开始 之 前 ， 我 们 需要 展示 一 个 命令 行 的 小 技巧 。 通 过 使 用 分 号 来 分 隔 多 
条 命令 ， 就 可 以 将 多 条 命令 输入 在 一 行 中 。 其 工作 方式 如 下 : 


command1;command2;commnand3 - . . 


我 们 将 要 使 用 的 例子 如 下 : 


[meelinuxbox -]$ cd /usr; 1s; cd - 

bin games kerberos Lib64 local share tmp 
etc include 1ib libexec sbin src 
/home/me 

[me@linuxbox ~]$ 


可 以 看 到 ， 我 们 将 3 条 命令 放置 在 同一 行 中 。 首 先 我 们 将 当前 目录 改变 成 
/usr， 然 后 列 出 这 个 目录 内 容 ， 最 后 返回 到 原始 目录 “使 用 cd-)。 那 么 程序 结束 
的 位 置 恰恰 是 开始 的 位 置 。 现 在 ， 我 们 通过 使 用 alias 命令 将 以 上 命令 整合 成 一 
条 新 的 命令 。 首 先 要 为 新 命令 虚构 出 一 个 名 称 ， 试 试 名 称 test。 不 过 输入 前 ， 我 
们 最 好 检查 一 下 名 称 test 是 否 已 经 被 使 用 过 了 。 为 此 ， 我 们 可 以 再 次 使 用 type 
命令 。 


[meelinuxbox ~]$ type test 
test is a shell builtin 


啊 哦 ! 这 个 名 字 已 经 用 过 了 ， 试 试 foo。 


[me@linuxbox ~]$ type foo 
bash: type: foo: not found 


太 好 了 1! foo 还 没有 被 使 用 。 下 面 创建 新 命令 的 别名 。 
TESTTPEZEIETTETEI 
注意 这 个 命令 的 结构 。 
alias name='string' 


在 alias 命令 之 后 输入 name， 紧 接着 是 一 个 等 号 〈 没 有 空格 )， 等 号 之 后 是 
一 个 用 单 引 号 括 起 来 的 字符 串 ， 该 字符 串 中 的 内 容 将 赋值 给 name。 定 义 好 的 别 
名 可 以 用 在 shell 期 待 的 任何 地 方 。 


尝试 如 下 命令 : 
Ime@linuxbox ~]$ foo 
bin games kerberos 1ib64 local share tmp 
etc include 1lib libexec sbin src 
/home/me 


[me@linuxbox ~]$ 
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也 可 以 再 次 使 用 type 命令 来 查看 别名 。 


[me@linuxbox ~]$ type foo 
foo is aliased to 'cd /usr; 1S j cd -' 


要 删除 别名 ， 可 以 使 用 unalias 命令 ， 如 下 所 示 。 


[me@linuxbox ~]$ unalias foo 
[me@linuxbox ~]$ type foo 
bash: type: foo: not found 


尽管 我 们 有 意 避 免 使 用 已 经 存在 的 命名 名 称 来 给 我 们 的 别名 命名 ,但 有 时 
也 会 期 待 这 么 做 。 这 样 做 的 目的 是 ， 为 每 一 个 经 常 调用 的 命令 添加 一 个 普遍 会 
用 到 的 选项 。 例 如 ， 前 面 讲 到 的 为 ls 命令 添加 别名 ， 以 添加 颜色 支持 。 


[me@linuxbox ~]$ type 1s 
ls is aliased to 'ls --color=tty' 


要 查看 在 环境 中 定义 的 所 有 别名 ， 可 是 使 用 不 带 参数 的 alias 命令 。 以 下 是 
Fedora 系统 默认 定义 的 一 些 别名 。 试 着 弄 明 和 白 它 们 是 干什么 的 。 
[me@linuxbox ~]$ alias 
alias 1.='ls -dd .* --color=tty' 


alias LI1='1S -1 --color=tty’ 
alias IS='1S --color=tty’ 


在 命令 行 定 义 别 名 还 有 一 个 小 问题 。 当 shell 会 话 结束 时 ， 这 些 别名 也 随 之 
消失 了 。 在 随后 的 章节 中 ， 我 们 将 学 习 如 何 向 文件 中 添加 别名 。 每 一 次 登录 系 
统 时 ， 这 些 文件 都 会 建立 系统 环境 。 现 在 ， 我 们 已 经 开始 迈 出 了 第 一 步 ， 纵 然 
它 微不足道 ， 可 毋庸 置疑 的 是 ， 现 在 我 们 已 经 走 进 了 shell 编程 的 世界 。 


5.5 温 故 以 求 新 


我 们 已 经 学 习 了 如 何 查找 命令 文档 ， 现 在 我 们 就 来 查看 之 前 遇 到 的 所 有 命 
令 的 文档 ， 学 习 一 下 这 些 命令 的 其 他 选项 ， 并 练习 使 用 。 


和 
定 


重 向 


本 章 我 们 将 要 探讨 命令 行 最 酷 的 功能 一 IO 重 定向 。LIO 是 输入 /输出 
(input/output》 的 缩写 。 这 个 功能 可 以 把 命令 行 的 输入 重 定向 为 从 文件 中 获取 内 
容 ， 也 可 以 把 命令 行 的 输出 结果 重 定向 到 文件 中 。 如 果 我 们 将 多 个 命令 行 关 联 
起 来 ， 将 形成 非常 强大 的 命令 一 一 管道 。 接 下 来 ， 我 们 将 通过 介绍 以 下 命令 来 
展示 这 一 功能 。 


。 cat: 合并 文件 。 

。 sort: 对 文本 行 排序 。 

。 uniq: 报告 或 删除 文件 中 重复 的 行 。 

。 wc: 打印 文件 中 的 换行 符 、 字 和 字 节 的 个 数 。 
e grep: 打印 匹配 行 。、 

。 head: 输出 文件 的 第 一 部 分 内 容 。 

。 tail， 输 出 文件 的 最 后 一 部 分 内 容 。 
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。 tee: 读 取 标 准 输入 的 数据 ， 并 将 其 内 容 输 出 到 标准 输出 和 文件 中 。 


6.1 标准 输入 、 标 准 输 出 和 标准 错误 

到 目前 为 止 ， 我们 使 用 过 的 很 多 程序 生成 了 不 同 种 类 的 输出 。 这 些 输出 通 
常 包含 两 种 类 型 。 一 种 是 程序 运行 的 结果 ， 即 该 程序 生成 的 数据 另 一 种 是 状 
态 和 错误 信息 ， 表 示 程 序 当前 的 运行 情况 。 比 如 输入 ls 命令 ， 屏 幕 上 将 显示 它 
的 运行 结果 以 及 它 的 相关 错误 信息 。 

与 UNIX “一切 都 是 文件 ”的 思想 一 致 ， 类 似 ls 的 程序 实际 上 把 它们 的 运 
行 结果 发 送 到 了 一 个 称 为 标准 输出 〈standard output， 通 常 表示 为 stdout) 的 特 
殊 文 件 中 ， 它 们 的 状态 信息 则 发 送 到 了 另 一 个 称 为 标准 错误 (standard error， 表 
示 为 stderr) 的 文件 中 。 默认 情况 下 ,标准 输出 和 标准 错误 都 将 被 链接 到 屏幕 上 ， 
并 且 不 会 被 保存 在 磁盘 文件 中 。 


另外 ， 许 多 程序 从 一 个 称 为 标准 输入 (standard input， 表 示 为 stdin) 的 设 
备 来 得 到 输入 。 默 认 情 况 下 ， 标 准 输入 连接 到 键盘 。 


LO 重 定向 功能 可 以 改变 输出 内 容 发 送 的 目的 地 , 也 可 以 改变 输入 内 容 的 来 
源 地 。 通 常 来 说 ， 输 出 内 容 显示 在 屏幕 上 ， 输 入 内 容 来 自 于 键盘 。 但 是 使 用 IO 
重 定向 功能 可 以 改变 这 一 惯例 。 


6.1.1 标准 输出 重 定向 


IO 重 定向 功能 可 以 重新 定义 标准 输出 内 容 发 送 到 哪里 。 使 用 重 定向 操作 符 
“>”， 后 面 接 文件 名 ， 就 可 以 把 标准 输出 重 定 向 到 另 一 个 文件 中 ， 而 不 是 显示 在 
屏幕 上 。 为 什么 我 们 需要 这 样 做 呢 ? 它 主要 用 于 把 命令 的 输出 内 容 保存 到 一 个 
文件 中 。 比 如 ， 我 们 可 以 按照 下 面 的 形式 把 ls 命令 的 输出 保存 到 ls-output.txt 文 
件 中 ， 而 不 是 输出 到 屏幕 上 。 


[me@linuxbox ~]$ 1s -1 /usr/bin > ls-output.txt 


这 里 ， 我 们 将 创建 /usr/bin 目录 的 一 个 长 列表 信息 ， 并 把 这 个 结果 输出 到 
1s-output.txt 文件 中 。 检 查 下 该 命令 被 重 定向 的 输出 内 容 。 


[meelinuxbox ~]$ 18 -1 ls-output.txt 
-rw-rw-r-- 1 me me 167878 2012-02-01 15:07 ls-output.txt 


这 是 一 个 不 错 的 大 型 文本 文件 。 如 果 使 用 less 命令 查看 这 个 文件 ， 我 们 可 
以 看 到 ls-output.txt 文件 确实 包含 了 ls 命令 的 执行 结果 。 
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[me@linuxbox ~]$ less ls-output.txt 


现在 ， 让 我 们 重复 重 定向 测试 ， 但 是 这 次 做 一 点 变换 。 我 们 把 目录 名 称 换 
成 一 个 不 存在 的 目录 。 


[meelinuxbox ~]$ ls -1 /bin/usr > ls-output.txt 
ls: cannot access /bin/usr: No such file or directory 


我 们 会 收 到 一 条 错误 信息 。 因 为 我 们 指定 的 是 一 个 不 存在 的 目录 /bin/usr， 
所 以 这 个 错误 信息 是 正确 的 。 但 是 为 什么 这 个 错误 信息 显示 在 屏幕 上 ， 而 不 是 
重 定向 到 1s-output.txt 文件 中 呢 ? 原因 是 1s 程序 并 不 会 把 它 运行 的 错误 信息 发 送 
到 标准 输出 文件 中 。 而 是 与 大 多 数 写 得 很 好 的 UNIX 程序 一 样 ， 它 把 错误 信息 
发 送 到 标准 错误 文件 中 。 因 为 我 们 只 重 定向 了 标准 输出 ， 并 没有 重 定向 标准 错 
误 ， 所 以 这 个 错误 信息 仍然 输出 到 屏幕 上 。 稍 后 我 们 将 讲述 如 何 重 定向 标准 错 
误 ， 但 是 首先 ， 先 让 我 们 看 看 这 个 输出 文件 发 生 了 什么 变化 。 


[meelinuxbox ~]$ ls -1 ls-output.txt 
-rw-rw-r-- 1 me me 0 2012-02-01 15:08 ls-output.txt 


当前 这 个 文件 大 小 为 零 ! 这 是 因为 当 使 用 重 定向 符 “>” 来 重 定向 标准 输出 
时 ， 目 的 文件 通常 会 从 文件 开头 部 分 重新 改写 。 由 于 ls 命令 执行 后 没有 输出 任 
何 内容 ， 只 是 显示 一 条 错误 信息 ， 所 以 重 定向 操作 开始 重新 改写 这 个 文件 ， 并 
在 出 现 错误 的 情况 下 停止 操作 ， 最 终 导 致 了 该 文件 内 容 被 删除 。 事 实 上 ， 如 果 
我 们 需要 删除 一 个 文件 内 容 ( 或 者 创建 一 个 新 的 空 文件 ), 可 以 采用 这 样 的 方式 。 


[me@linuxbox ~]$ > ls-output.txt 


仅仅 使 用 了 重 定向 符 ， 并 在 它 之 前 不 加 任何 命令 ， 就 可 以 删除 一 个 已 存在 
的 文件 内 容 或 者 创建 一 个 新 的 空 文件 。 


那么 ， 我 们 如 何 能 够 不 从 文件 的 首位 置 开 始 覆 盖 文 件 ， 而 是 从 文件 的 尾部 
开始 添加 输出 内 容 呢 ? 我 们 可 以 使 用 重 定向 符 “>>” 来 实现 ， 比 如 : 


[me@linuxbox -~]$ 1s -1 /usr/bin >> ls-output.txt 


使 用 重 定向 符 >> 将 使 得 输出 内 容 添 加 在 文件 的 尾部 。 如 果 这 个 文件 并 不 存 
在 ， 将 与 操作 符 > 的 作用 一 样 创建 这 个 文件 。 下 面 验证 一 下 该 操作 符 。 


[meelinuxbox ~]$ 18 -1 /usr/bin >> ls-output.txt 
[meelinuxbox ~]$ 1s -1 /usr/bin >> ls-output.txt 
[meelinuxbox ~]$ 18 -1 /usr/bin >> ls-output.txt 
[me@linuxbox ~]$ 1s -1 ls-output.txt 

-rw-rw-r-- 1 me me 503634 2012-02-01 15:45 ls-output.txt 


重复 执行 这 条 命令 三 次 , 系统 将 最 终生 成 一 个 为 原来 三 倍 大 小 的 输出 文件 。 
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6.1.2 ”标准 错误 重 定向 


6.1.3 


标准 错误 的 重 定向 并 不 能 简单 地 使 用 一 个 专用 的 重 定向 符 来 实现 。 要 实现 
标准 错误 的 重 定 向 ， 不 得 不 提 到 它 的 文件 描述 符 〈file descriptor)。 一 个 程序 可 
以 把 生成 的 输出 内 容 发 送 到 任意 文件 流 中 。 如 果 把 这 些 文件 流 中 的 前 三 个 分 别 
对 应 标准 输入 文件 、 标 准 输出 文件 和 标准 错误 文件 ， 那 么 shell 将 在 内 部 用 文件 
描述 符 分 别 索引 它们 为 0、1 和 2。shell 提供 了 使 用 文件 描述 符 编号 来 重 定向 文 
件 的 表示 法 。 由 于 标准 错误 等 同 于 文件 描述 符 2, 所 以 可 以 使 用 这 种 表示 法 来 重 
定向 标准 错误 。 


[meelinuxbox ~]$ 1s -1 /bin/usr 2> ls-error.txt 


文件 描述 符 “2” 紧 放 在 重 定向 符 之 前 ， 将 标准 错误 重 定向 到 ls-errortxt 
文件 中 。 


将 标准 输出 和 标准 错误 重 定 向 到 同一 个 文件 


在 许多 情况 下 ， 我 们 会 希望 把 一 个 命令 的 所 有 输出 内 容 都 放 在 同一 个 独立 
的 文件 中 。 为 此 ， 我 们 必须 同时 重 定向 标准 输出 和 标准 错误 。 有 两 种 方法 可 以 
满足 要 求 。 第 一 种 是 传统 的 方法 ， 在 旧版 本 的 shell 中 使 用 。 
Ime@linuxbox ~]$ ls -1 /bin/usr > ls-output.txt 2>&1 

使 用 这 个 方法 ， 将 执行 两 个 重 定向 操作 。 首 先 重 定向 标准 输出 到 ls-output.txt 


文件 中 ， 然 后 使 用 标记 符 2>&1 把 文件 描述 符 2《〈 标 准 错误 ) 重 定向 到 文件 描述 
符 1〈 标 准 输出 ) 中 。 | 


这 些 重 定向 操作 的 顺序 是 非常 重要 的 。 标 准 错误 的 重 定向 操作 通常 发 生 在 


标准 输出 重 定向 操作 之 后 ， 否 则 它 将 不 起 作用 。 在 上 面 的 例子 中 ,>ls-outputtxt 
2>&1 把 标准 错误 重 定向 到 1s-output.txt 文件 中 ， 但 是 如 果 顺 序 改 变 为 2>&1>1s- 
output.txt， 那 么 标准 错误 将 会 重 定向 到 屏幕 上 。 


最 近 的 bash 版 本 提供 了 效率 更 高 的 第 二 种 方法 来 实现 这 一 联合 的 重 定向 
操作 。 
[me@linuxbox ~]$ ls -1 /bin/usr 8&> 1s-output.txt 


在 这 个 例子 中 ， 只 使 用 一 个 标记 符 “&>” 就 把 标准 输出 和 标准 错误 都 重 定 
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向 到 了 Ls-output.txt 文件 中 。 


6.1.4 ”处 理 不 想 要 的 输出 


有 时 候 “ 沉 默 是 金 ” 命令 执行 后 我 们 并 不 希望 得 到 输出 ， 而 是 想 把 这 个 输 
出 丢弃 ， 尤 其 是 在 输出 错误 和 状态 信息 的 情况 下 更 为 需要 。 系 统 提供 了 一 种 方 
法 ， 即 通过 把 输出 重 定向 到 一 个 称 为 /dev/null 的 特殊 文件 中 来 实现 它 。 这 个 文 
件 是 一 个 称 为 位 桶 (bit bucket) 的 系统 设备 ， 它 接受 输入 但 是 不 对 输入 进行 任 
何 处 理 。 以 下 命令 可 以 用 来 抑制 〈 即 隐藏 ) 一 个 命令 的 错误 信息 。 


[meelLinuxbox ~]$ 1s -1 /bin/usr 2> /dev/nuil 


UNIX 文化 中 的 /DEV/NULL 
位 桶 (bit bucket ) 是 一 个 古老 的 UNIX 概念 ， 由 于 它 的 普 适 性 ， 它 出 现在 
UNIX 文化 的 很 多 地 方 。 因 此 当 某 人 说 他 正 把 你 的 意见 发 送 到 “dev null” 的 时 
候 ， 现 在 你 知道 他 是 什么 意思 了 。 你 可 以 在 http://en.wikipedia.org/wiki/Dev/null 
中 查看 维基 百科 的 相关 文章 ， 了 解 更 多 的 相关 示例 。 


6.1.5 标准 输入 重 定向 


到 目前 为 止 , 我 们 还 没有 接触 过 使 用 标准 输入 的 命令 (实际 上 已 经 遇 到 了 ， 
稍 后 将 揭晓 这 个 谜底 )， 接 下 来 我 们 先 介绍 一 个 命令 。 


cat 一 一 合并 文件 
cat 命令 读 取 一 个 或 多 个 文件 ， 并 把 它们 复制 到 标准 输出 文件 中 ， 格 式 如 下 。 


cat [file...] 


在 大 多 数 情况 下 ， 你 可 以 认为 cat 命令 和 DOS 中 的 TYPE 命令 类 似 。 使 用 
它 显示 文件 而 不 需要 分 页 ， 例 如 : 


[me@linuxbox ~-]$ cat ls-output.txt 


将 显示 ls-output.txt 文件 的 内 容 。cat 经 常用 来 显示 短 的 文本 文件 。 由 于 cat 可 以 
接受 多 个 文件 作为 输入 参数 ， 所 以 它 也 可 以 用 来 把 文件 连接 在 一 起 。 假 设 我 们 下 
载 了 一 个 很 大 的 文件 ， 它 已 被 拆 分 为 多 个 部 分 (Usenet 上 的 多 媒体 文件 经 常 采 
用 拆 分 这 种 方式 )， 现 在 我 们 想 要 把 各 部 分 连接 在 一 起 ， 并 还 原 为 原来 的 文件 。 
如 果 这 些 文件 命名 为 
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movie .mpeg.001 movie .mpeg.002...movie.mpeg.099 
我 们 可 以 使 用 这 个 命令 让 它们 重新 连接 在 一 起 。 
[me@linuxbox ~]$ cat movie.mpeg.0* > movie.mpeg 


通配符 一 般 都 是 按照 顺序 来 扩展 的 ， 因此 这 些 参数 将 按 正确 的 顺序 来 排列 。 


虽然 这 样 很 好 ， 但 是 这 跟 标 准 输入 有 什么 关系 呢 ? 确实 没有 任何 关系 ,但 
是 我 们 可 以 试 试 其 他 的 情况 。 如 果 输 入 cat 命令 却 不 带 任 何 参 数 , 会 出 现 什 么 样 
的 结果 呢 ? 


[meelinuxbox ~]$ cat 


没有 任何 结果 一 一 它 只 是 停 在 那 边 不 动 ， 好 像 它 已 经 挂 起 了 。 看 起 来 好 像 
是 这 样 的， 但 是 它 实际 上 正在 执行 我 们 期 望 它 做 的 事情 。 


如 果 cat 命令 没有 给 定 任何 参数 , 它 将 从 标准 输入 读 取 内 容 。 由 于 标准 输入 
在 默认 情况 下 是 连接 到 键盘 ， 所 以 实际 上 它 正 在 等 待 着 从 键盘 输入 内 容 ! 


试 下 这 个 。 


[me@linuxbox ~]$ cat 
The quick brown fox jumped over the lazy dog. 


下 一 步 ， 按 下 Ctrl-D (〈 按 住 Ctrl 键 同时 按 下 D)， 告 知 cat 命令 它 已 经 达到 
了 标准 输入 的 文件 尾 (end-of-file，EOF)。 
[me@linuxbox ~]$ cat 


The quick brown fox jumped over the lazy dog. 
The quick brown fox jumped over the lazy dog. 


在 缺少 文件 名 参数 的 情况 下 ，cat 将 把 标准 输入 内 容 复 制 到 标准 输出 文件 
中 ， 因 此 我 们 将 看 到 文本 行 重复 显示 。 用 这 种 方法 我 们 可 以 创建 短 的 文本 文件 。 
如 果 想 要 创建 一 个 名 叫 jazy_dog.-txt 的 文件 ,文件 中 包含 之 前 例子 中 的 文本 内 容 ， 
我 们 可 以 这 样 做 : 


[meelinuxbox ~]$ cat > lazy dog.txt 
The quick brown fox junped over the lazy dog. 


在 cat 命令 后 输入 想 要 放 在 文件 中 的 文本 内 容 。 记 住 在 文件 结束 时 按 下 
Ctrl-D。 使 用 这 个 命令 行 ， 相 当 于 执行 了 世界 上 最 轧 夸 的 文字 处 理 器 ! 为 了 看 到 
结果 ， 我 们 可 以 使 用 cat 命令 再 次 把 文件 复制 到 标准 输出 文件 中 。 


{me@linuxbox ~]$ cat lazy_ dog.txt 
The quick brown fox jumped over the lazy dog. 
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现在 我 们 已 经 知道 cat 命令 除了 接受 文件 名 参数 之 外 ， 是 如 何 接受 标准 输入 
的 。 接 下 来 尝试 一 下 标准 输入 的 重 定向 。 


[me@linuxbox ~]$ cat < lazy_dog.txt 
The quick brown fox jumped over the lazy dog. 


使 用 重 定向 符 “<” 我 们 将 把 标准 输入 的 源 从 键盘 变 为 lazy_dog.txt 文件 。 
可 以 看 到 ， 得 到 的 结果 和 只 传递 单个 文件 名 参数 的 结果 一 样 。 和 传输 一 个 文件 名 
参数 的 方式 作对 比 ， 这 种 方式 并 不 是 特别 的 有 用 ， 但 是 可 以 用 来 说 明 把 一 个 文件 
作为 标准 输入 的 源 文 件 。 还 有 其 他 的 命令 更 好 地 使 用 了 标准 输入 ， 稍 后 会 讲 到 。 


在 继续 学 习 下 面 内 容 之 前 , 我 们 可 以 查看 cat 命令 的 手册 文档 , 因为 它 有 几 
个 有 趣 的 选项 。 


6.2 管道 


命令 从 标准 输入 到 读 取 数据 ， 并 将 数据 发 送 到 标准 输出 的 能 力 ， 是 使 用 了 
名 为 管道 的 shell 特性 。 使 用 管道 操作 符 “|”( 竖 线 ) 可 以 把 一 个 命令 的 标准 输 
出 传送 到 另 一 个 命令 的 标准 输入 中 。 

CommandyT | command2 

为 了 充分 证 明 这 一 点 ， 我 们 需要 一 些 命令 。 还 记得 之 前 说 过 有 一 条 已 知 的 
命令 可 以 接受 标准 输入 吗 ? 它 就 是 less 命令 。 使 用 less 命令 可 以 分 页 显示 任意 
命令 的 输入 ， 该 命令 将 它 的 结果 发 送 到 标准 输出 。 


[me@linuxbox ~]$ ls -1 /usr/bin | less 


这 相当 方便 ! 通过 使 用 该 技术 ， 可 以 很 方便 地 检查 任意 一 条 生成 标准 输出 
的 命令 的 运行 结果 。 


6.2.1 过 滤器 


管道 功能 经 常用 来 对 数据 执行 复杂 的 操作 。 也 可 以 把 多 条 命令 合 在 一 起 构 
成 一 个 管道 。 这 种 方式 中 用 到 的 命令 通常 被 称 为 过 滤器 filter)。 过 滤器 接受 输 
入 ,按照 某 种 方式 对 输入 进行 改变 , 然后 再 输出 它 。 第 一 个 要 用 到 的 命令 是 sort。 
假设 要 把 /bin 和 /usr/bin 目录 下 的 所 有 可 执行 程序 合并 成 一 个 列表 ， 并 且 按 照 顺 
序 排列 ， 最 后 再 查看 这 个 列表 。 


[me@linuxbox ~]$ 1s /bin /usr/bin | sort | less 
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由 于 我 们 指定 了 两 个 目录 Cbin 和 /usr/bin), 1s 的 输出 将 包含 两 个 排 好 序 的 列 
表 ， 每 个 对 应 一 个 目录 。 通 过 在 管道 中 包含 sort 命令 ， 我 们 改变 输出 数据 ， 从 
而 产生 一 个 排 好 序 的 列表 。 


6.2.2 ”uniq 一 一 报告 或 忽略 文件 中 重复 的 行 


uniq 命令 经 常 和 sort 命令 结合 使 用 。uniq 可 以 接受 来 自 于 标准 输入 或 者 一 
个 单一 文件 名 参数 对 应 的 已 排 好 序 的 数据 列表 (可 以 查看 uniq 命令 的 man 页 面 
获取 详细 信息 )。 默 认 情 况 下 ， 该 命令 删除 列表 中 的 所 有 重复 行 。 因 此 ， 在 管道 
中 添加 uniq 命令 ， 可 以 确保 所 有 的 列表 都 没有 重复 行 〈 即 在 /bin 和 /usr/bin 目录 
下 都 出 现 的 相同 名 字 的 任意 程序 )。 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | less 


在 这 个 例子 中 ， 我 们 使 用 了 unig 命令 来 删除 来 自 sort 命令 输出 内 容 中 的 任 
意 重 复 行 。 如 果 反 过 来 想 要 查看 重复 行 的 列表 ， 可 以 在 uniq 命令 后 面 添加 -d 选 
项 ， 如 下 所 示 。 


[me@linuxbox ~]$ 1s /bin /usr/bin | sort | uniq -d | less 


6.2.3 ”wc 一 一 打印 行 数 、 字 数 和 字 节 数 


wec (字数 统计 ，word count) 命令 用 来 显示 文件 中 包含 的 行 数 、 字 数 和 字 节 
数 。 例 如 : 


[me@linuxbox ~]$ we ls-output.txt 
7902 64566 503634 ls-output.txt 


在 这 个 例子 中 ， 我 们 打印 输出 了 三 个 数据 ， 即 ls-output.txt 文件 中 包含 的 行 数 、 
字数 和 字 节 数 。 和 前 面 的 命令 一 样 ， 如 果 在 执行 we 时 没有 输入 输入 命令 行 参数 ， 它 
将 接受 标准 输入 内 容 。-1 选项 限制 命令 只 报告 行 数 , 把 它 添加 在 管道 中 可 以 很 方便 地 
实现 计数 功能 。 如 果 我 们 要 查看 已 排 好 序 的 列表 中 的 条 目 数 ， 可 以 按 以 下 方式 输入 。 


[meelinuxbox ~]$ 1s /bin /usr/bin | sort | uniq | we -1 
2728 


6.2.4 grep 一 一 打印 匹配 行 


grep 是 一 个 功能 强大 的 程序 ， 它 用 来 在 文件 中 查找 匹配 文本 ， 其 使 用 方式 
如 下 。 
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grep pattern [file...] 

当 grep 在 文件 中 遇 到 “模式 ”的 时 候 ， 将 打印 出 包含 该 模式 的 行 。grep 能 
够 匹配 的 模式 内 容 可 以 是 非常 复杂 的 ， 不 过 这 里 ， 我 们 只 关注 简单 文本 的 匹配 。 
在 第 19 章 ， 我 们 将 介绍 “正则 表达 式 〈regular expression)” 的 高 级 模式 。 


如 果 想 我 们 从 列 出 的 程序 中 搜索 出 文件 名 中 包含 zip 的 所 有 文件 ， 该 搜索 将 
获悉 系统 中 与 文件 压缩 相关 的 程序 ， 操 作 如 下 。 


[me@linuxbox -]$ ls /bin /usr/bin | sort | uniq | grep zip 
bunzip2 
bzip2 
gunzip 
gzip 
unzip 
zip 
zipcloak 
zipgrep 
zipinfo 
zipnote 
zipsplit 


grep 存在 一 对 方便 的 选项 : -i， 该 选项 使 得 grep 在 搜索 时 忽略 大 小 写 (通常 情 
况 下 ， 搜 索 是 区 分 大 小 写 的 )，-v， 该 选项 使 得 grep 只 输出 和 模式 不 匹配 的 行 。 


6.2.5 ”head/tail 一 一 打印 文件 的 开头 部 分 /结尾 部 分 


有 的 时 候 ， 你 并 不 需要 命令 输出 的 所 有 内 容 ， 可 能 只 是 需要 开头 几 行 或 者 
最 后 几 行 。head 命令 将 输出 文件 的 前 10 行 ，tail 命令 则 输出 文件 的 最 后 10 行 。 
默认 情况 下 ， 这 两 条 命令 都 是 输出 文件 的 10 行内 容 ， 不 过 可 以 使 用 -n 选项 来 调 
整 输出 的 行 数 。 


[me@linuxbox ~]$ head -n 5 ls-output.txt 
total 343496 


-PWXF-Xr-X 1 root root 31316 2011-12-05 08:58 [ 

-rwxr-xr-x 1 root root 8240 2011-12-09 13:39 411toppm 
-Pwxr-xr-x 1 root root 111276 2011-11-26 14:27 a2p 

-rwxr-xr-x 1 root root 25368 2010-10-06 20:16 a52dec 
[me@linuxbox ~]$ tail -n 5 ls-output.txt 

-rwxr-xr-x 1 root root 5234 2011-06-27 10:56 znew 

-MWwxr-xr-x 1 root root 691 2009-09-10 04:21 zonetab2pot.py 
-rw-r--r-- 1 root root 930 2011-11-01 12:23 zonetab2pot.pyc 
-rw-r--r-- 1 root root 930 2011-11-01 12:23 zonetab2pot .pyo 
lrwxrwxrwx 1 root root 6 2012-01-31 05:22 zsoelim -> soelim 


这 些 命令 选项 也 可 以 应 用 在 管道 中 。 


[me@linuxbox ~]$ ls /usr/bin | tail -n 5 
znew 


56 Linux 命令 行 大 全 


zonetab2pot .py 
Zonetab2pot ,pyC 
Zonetab2pot .pyo 
zsoelim 


tail 中 有 一 个 选项 用 来 实时 查看 文件 , 该 选项 在 观察 正在 被 写 入 的 日 志文 件 
的 进展 状态 时 很 有 用 。 在 下 面 的 例子 中 ， 我 们 将 观察 /var/log 目录 下 的 messages 
文件 。 因 为 /var/log/messages 文件 可 能 包含 安全 信息 ， 所 以 在 一 些 Linux 发 行 版 
本 中 ， 需 要 超级 用 户 的 权限 才能 执行 该 操作 。 


Ime@linuxbox ~]$ tail -f /var/log/messages 

Feb 8 13:40:05 twin4 dhclient: DHCPACK from 192.168.1.1 

Feb 8 13:40:05 twin4 dhclient: bound to 192.168.1.4 -- renewal in 1652 
seconds. 

Feb 8 13:55:32 twin4 mountd[3953]: /var/NFSv4/musicbox exported to both 
192.168.1.0/24 and twin7.localdomain in 192.168.1.0/24,twin7.localdomain 
Feb 8 14:07:37 twin4 dhclient: DHCPREQUEST on eth0 to 192.168.1.1 port 67 
Feb 8 14:07:37 twin4 dhclient: DHCPACK from 192.168.1.1 

Feb 8 14:07:37 twin4 dhclient: bound to 192.168.1.4 -- renewal in 1771 
seconds. 

Feb 8 14:09:56 twin4 smartd[3468]: Device: /dev/hda, SMART Prefailure 
Attribute: 8 Seek Time Performance changed from 237 to 236 

Feb 8 14:10:37 twin4 mountd[3953]: /var/NFSv4/musicbox exported to both 
192.168.1.0/24 and twin7.localdomain in 192.168.1.0/24,twin7.10caldomain 
Feb 8 14:25:07 twin4 sshd(pam unix)[29234]: session opened for User me by 
(uid=0) 

Feb 8 14:25:36 twin4 su(pam unix)[29279]: session opened for user root by 
me (uid=500) 


使 用 节选 项 ，tail 将 持续 监视 这 个 文件 ， 一 旦 添加 了 新 行 ， 新 行将 会 立即 显 
示 在 屏幕 上 。 该 动作 在 按 下 Ctrl-C 后 停止 。 


6.2.6 ”tee 一 一 从 stdin 读 取 数据 ， 并 同时 输出 到 stdout 和 文件 


为 了 和 我 们 的 管道 隐喻 保持 一 致 ，Linux 提供 了 一 个 叫做 tee 的 命令 ， 就 好 
像 安装 了 一 个 “T” 在 管道 上 。tee 程序 读 取 标 准 输入 ， 再 把 读 到 的 内 容 复制 到 
标准 输出 (允许 数据 可 以 继续 向 下 传递 到 管道 中 )〉 和 一 个 或 更 多 的 文件 中 去 。 
当 在 某 个 中 间 处 理 阶段 来 捕获 一 个 管道 中 的 内 容 时 ， 会 很 有 用 。 这 里 我 们 重复 
使 用 之 前 的 一 个 例子 , 这 次 在 使 用 grep 命令 过 滤 管 道内 容 之 前 ,我 们 先 使 用 tee 
命令 来 获取 整个 目录 列表 并 输出 到 ls.txt 文件 中 ， 具 体操 作 如 下 。 


[meelinuxbox ~]$ 1s /usr/bin | tee ls.txt | grep zip 
bunzip2 

bzip2 

gunzip 

gzip 

unzip 

zip 

zipcloak 
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zipgrep 
zipinfo 
zipnote 
zipsplit 


6.3 本章 结尾 语 


和 以 前 一 样 ， 请 查看 本 章 介 绍 的 各 个 命令 的 相关 文档 。 本 章 只 介绍 了 这 些 
命令 最 基本 的 用 法 ， 它 们 都 还 有 很 多 其 他 有 趣 的 选项 。 在 有 一 定 Linux 使 用 经 
验 的 时 候 ， 我 们 将 会 发 现 命令 行 的 重 定向 功能 对 于 解决 某 些 特定 的 问题 相当 
有 用 。 很 多 命令 使 用 了 标准 输入 和 输出 ， 而 且 几 乎 所 有 的 命令 行程 序 都 使 用 了 
标准 错误 来 显示 它们 的 提示 性 信息 。 


富有 想象 力 的 Linux 

每 当 被 问 到 Windows 和 Linux 的 区 别 时 ， 我 经 常 通过 用 玩具 打 比 方 的 方 
式 来 进行 解释 。 

Windows 就 像 是 Game Boy 游戏 机 。 你 去 商店 买 了 一 个 全 新 的 游戏 机 。 
你 把 它 带 回 家 ， 启 动 它 ， 开 始 玩 这 个 游戏 机 。 漂 亮 的 画面 ， 可 爱 的 声音 。 但 
是 不 久 ， 你 对 这 款 游戏 机 玩 腊 了 ， 于 是 你 回 到 商店 ， 买 了 另 一 款 游戏 机 。 这 
个 过 程 一 遍 一 遍地 重复 着 . 最 后 , 你 再 次 回 到 商店 ,对 柜台 后 的 售货员 说 “我 
想 要 一 款 可 以 玩 这 个 游戏 的 游戏 机 !” 但 是 却 被 告知 因为 没有 针对 它 的 “市 场 
需求 "， 所 以 并 不 存在 这 种 游戏 机 。 然 后 你 会 说 “但 是 我 只 需要 更 换 这 一 个 东 
西 就 行 了 ?”。 柜 台 后 的 售货员 将 会 对 你 说 ， 你 不 能 更 换 它 。 这 个 游戏 机 使 子 都 
是 完全 密封 好 的 。 你 发 现 你 的 玩具 选择 范围 被 限定 了 ， 你 只 能 选择 由 别人 决 
定 的 认为 你 需要 的 游戏 ， 并 没有 其 他 更 多 的 游戏 可 选 。 

而 另 一 方面 ，Linux 就 像 是 世界 上 最 大 的 建筑 拼装 玩具 。 你 打开 它 ， 发 现 
它 只 是 一 个 超大 的 零件 集 一 一 一 大 堆 的 钢 架 、 螺 丝 钉 、 螺 帽 、 齿 轮 、 滑 轮 组 
以 及 马达 ， 另 附 上 可 拼装 的 一 些 参考 样式 图 和 案 。 你 开始 玩 这 个 玩具 。 你 拼装 
了 一 种 参考 样式 后 ， 再 接着 拼装 另 一 种 。 不 久 ， 你 发 现 你 可 以 拼装 出 自己 想 
要 的 样式 。 你 不 再 需要 非得 回 到 商店 ， 因 为 你 已 经 有 你 需要 的 所 有 东西 。 这 
个 建筑 拼装 玩具 可 以 呈现 出 你 想象 的 形状 ， 它 可 以 实现 你 所 想 要 的 。 

当然 ， 选 择 哪个 玩具 是 你 自己 的 事情 ， 你 觉得 你 会 更 加 钟情 于 哪 种 玩 
具 呢 ? 
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在 本 章 ， 我 们 将 介绍 在 按 下 Enter 键 时 ， 命 令 行 中 发 生 的 一 些 “ 神 奇 ” 
事情 。 虽 然 我 们 会 介绍 shell 的 几 个 有 趣 而 复杂 的 特性 ， 但 是 我 们 只 使 用 一 条 
新 命令 来 处 理 。 


。 echo: 显示 一 行文 本 。 


7.1 扩展 


每 次 输入 命令 行 按 下 Enter 键 时 ，bash 都 会 在 执行 命令 之 前 对 文本 进行 多 重 
处 理 。 前 面 已 经 见 过 一 个 简单 的 字符 序列 《比如 *) 在 shell 中 被 识别 为 多 种 意 
思 的 几 个 例子 。 产 生 这 个 结果 的 处 理 过 程 称 为 扩展 (expansion)。 有 了 扩展 功能 ， 
在 输入 内 容 后 , 这 些 内 容 将 在 shell 对 其 执行 之 前 被 扩展 成 其 他 内 容 。 为 了 证 明 这 
点 ， 让 我 们 先 来 看 看 echo 命令 。echo 是 shell 的 一 个 内 置 命令 ， 它 执行 的 任务 
非常 简单 ， 即 把 文本 参数 内 容 打 印 到 标准 输出 。 
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[meelinuxbox ~]$ echo this is a test 
this is a test 


这 个 例子 相当 简单 ， 传 递 给 echo 的 任何 参数 都 将 显示 出 来 。 让 我 们 再 看 男 
一 个 例子 。 ， 


[me@linuxbox ~]$ echo * 
Desktop Documents ls-output.txt Music Pictures Public Templates Videos 


刚刚 发 生 了 什么 ? 为 什么 echo 不 是 输出 “*” 呢 ?回想 一 下 之 前 我 们 对 通 
配 符 的 使 用 。“*” 字 符 意味 着 “匹配 文件 名 中 的 任意 字符 ”但 是 之 前 我 们 并 没 
有 讨论 shell 是 如 何 实现 这 个 功能 的 。 答 案 很 简单 ，shell 会 在 执行 echo 命令 前 
把 “*” 字 符 扩 展 成 其 他 内 容 〈 在 这 个 例子 中 ， 扩 展 为 当前 工作 目录 下 的 所 有 文 
件 名 )。 在 按 下 Enter 键 的 时 候 ，shell 会 在 执行 命令 前 自动 扩展 命令 行 中 所 有 符 
合 条 件 的 字符 ， 因 此 echo 命令 将 不 可 能 看 到 “*” 字 符 ， 只 能 看 到 “*” 字 符 扩 
展 后 的 结果 。 知 道 了 这 些 ， 我 们 就 会 发 现 echo 命令 输出 的 正 是 预期 的 结果 。 


7.1.1 路 径 名 扩展 
通过 使 用 通配符 来 实现 扩展 的 机 制 称 为 路 径 名 扩展 (pathname expansion )。 
试 试 在 前 面 章 节 中 使 用 过 的 一 些 技术 ， 将 会 发 现 它们 实际 上 就 是 扩展 。 下 面 给 
定 一 个 主 目录 ， 如 下 所 示 : 


[me@linuxbox ~]$ ls 
Desktop 1s-output.txt Pictures Templates 
Documents Music Public Videos 


执行 下 面 的 扩展 : 


[me@linuxbox ~]$ echo D* 
Desktop Documents 


以 及 


[meelinuxbox ~]$ echo *s 
Documents Pictures Templates Videos 


甚至 是 


[meelinuxbox ~]$ echo. [[:upper:]]* 
Desktop Documents Music Pictures Public Templates Videos 


查看 除 主 目录 之 外 的 目录 : 


[me@linuxbox ~]$ echo /usr/*/share 
/usr/kerberos/share /usr/local/share 
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件 ， 如 下 所 未 。， vs 


echo * 


前 目录 的 父 目 录 Dn ewe 
ls -d .*lless 可 以 发 现 这 个 结果 是 不 正确 的 。 

在 详 种 情 ， ; 要 正确 地 执行 路 径 名 扩 民 多 人 有 + 更生 些 的 模 

忆 。， [1 7 ee ， 和 

这 种 模式 将 扩展 为 以 以 一 个 点 .字符 开头 的 所 有 冯 文件 名 ， 广 人 .名 中 并 不 包含 

第 个 点 字符 ， 但 包含 至 少 一 个 额外 的 字符 ， 后 面 也 可 能 还 跟着 其 他 的 字符 。 


7.1.2 ”波浪 线 扩展 


回顾 前 面 对 cd 命令 的 介绍 ， 你 会 发 现 波浪 线 字 符 《〈 人 一) 具有 特殊 的 含义 。 
如 果 把 它 用 在 一 个 单词 的 开头 ， 那 么 它 将 被 扩展 为 指定 用 户 的 主 目录 名 ; 如果 
没有 指定 用 户 命名 ， 则 扩展 为 当前 用 户 的 主 目录 。 


[me@linuxbox ~]$ echo ~ 
/home /me 


如 果 有 用 户 foo 这 个 账户 ， 那 么 : 


[me@linuxbox ~]$ echo ~foo 
/home/foo 


7.1.3 算术 扩展 


shell 支持 通过 扩展 来 运行 算术 表达 式 。 这 人 允许 我 们 把 shell 提示 符 当 作 计 算 
器 来 使 用 。 


[me@linuxbox ~]$ echo $((2 + 2)) 
4 
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算术 扩展 使 用 如 下 格式 。 
$({expression)) 
其 中 ，expression 是 指 包 含 数值 和 算术 操作 符 的 算术 表达 式 。 


算术 扩展 只 支持 整数 (全 是 数字 ,没有 小 数 ), 但 是 可 以 执行 很 多 不 同 的 运 
算 。 表 7-1 列 出 了 一 些 支 持 的 操作 符 。 


表 7-1 算术 运算 符 

运算 符 描述 

加 

本 减 

乘 

/ 除 (但 是 记 住 ， 因 为 扩展 只 支持 整数 运算 ， 所 以 结果 也 是 整数 ) 
% 取 余 ， 即 余数 

社 襟 取 寡 


空格 在 算术 表达 式 中 是 没有 意义 的 ， 而 且 表 达 式 是 可 以 嵌 套 的 。 例 如 把 和 
和 3 相 乘 。 


[meelinuxbox ~]$ echo $(($((5**2)) * 3)) 
75 


你 可 以 使 用 一 对 括号 来 组 合 多 个 子 表达 式 。 通 过 该 技术 ， 可 以 把 上 面 的 例 
子 重 写 ， 用 一 个 扩展 来 代替 两 个 ， 可 以 得 到 同样 的 结果 : 


[meelinuxbox ~]$ echo $(((5**2) * 3)) 
75 


下 面 的 例子 使 用 了 除 运 算 符 和 取 余 运算 符 ， 注 意 整 数 相 除 的 结果 。 


Ime@linuxbox ~]$ echo Five divided by two equals $((5/2)) 
Five divided by two equals 2 

[me@linuxbox -~]$ echo with $((5%2)) left over. 

with 1 left over. 


在 第 34 章 我 们 将 更 详细 地 介绍 算术 扩展 。 


7.1.4” 花 括号 扩展 


花 括号 扩展 〈brace expansion) 可 能 算是 最 奇怪 的 扩展 方式 了 。 有 了 它 ， 你 
可 以 按照 花 括 号 里 面 的 模式 创建 多 种 文本 字符 串 。 实 例如 下 。 


[meelinuxbox ~]$ echo Front-{A,B8,C}-Back 
Front-A-Back Front-B-Back Front-C-Back 
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用 于 花 括号 扩展 的 模式 信息 可 以 包含 一 个 称 为 前 导 字符 (preamble) 的 开头 
部 分 和 一 个 称 为 附 言 (postscript》 的 结尾 部 分 。 花 括号 表达 式 本 身 可 以 包含 一 
系列 逗号 分 隔 的 字符 串 ， 也 可 以 包含 一 系列 整数 或 者 单个 字符 。 这 里 的 模式 信 
息 不 能 包含 内 插 的 空白 。 下 面 的 例子 使 用 了 一 系列 的 整数 。 


[me@linuxbox ~]1$ echo Number_{1..5} 
Number 1f Number 2 Number 3 Number 4 Number 5 


下 面 输出 一 系列 逆序 排列 的 字母 。 


[meelinuxbox -]$ echo {Z. .Ah 
ZYXWVUTSRAPONMLKJIHGFEDCBA 


花 括 号 扩展 支持 艇 套 。 


[me@linuxbox ~]$ echo a{A{1,2},B{3,4}}b 
aA1b aA2b aB3b aB4b 


那么 花 括号 扩展 一 般 应 用 在 哪些 地 方 呢 ? 最 普遍 的 应 用 是 创建 一 系列 的 文 
件 或 者 目录 。 比 如 说 ， 摄 影 师 有 一 个 很 大 的 图 片 集 ， 想 要 按 年 份 和 月 份 来 对 这 
些 图 片 进行 分 组 , 那么 要 做 的 第 一 件 事 就 是 创建 一 系列 以 年 月 格式 命名 的 目录 。 
这 样 ， 这 些 目 录 名 将 会 按照 年 代 顺 序 排列 ， 输 出 目录 的 一 个 完整 的 列表 。 但 是 
这 样 做 工作 量 大 ， 而 且 容 易 出 错 。 为 此 我 们 可 以 这 样 操 作 。 

[me@linuxbox ~]$ mkdir Pics 

[me@linuxbox ~]$ cd Pics 

[me@linuxbox Pics]$ mkdir {2009..2011}-0{1..9} {2009..2011}-{10..12} 
[me@linuxbox Pics]$ 1s 

2009-01 2009-07 2010-01 2010-07 2011-01 2011-07 

2009-02 2009-08 2010-02 2010-08 2011-02 2011-08 

2009-03 2009-09 2010-03 2010-09 2011-03 2011-09 

2009-04 2009-10 2010-04 2010-10 2011-04 2011-10 


2009-05 2009-11 2010-05 2010-11 2011-05 2011-11 
2009-06 2009-12 2010-06 2010-12 2011-06 2011-12 


相当 巧妙 ! 


7.1.5 参数 扩展 


本 章 我 们 只 是 简要 地 介绍 参数 扩展 (parameter expansion)， 在 之 后 的 章 
节 中 我 们 将 会 更 深入 地 介绍 它 。 参 数 扩展 用 在 shell 脚本 中 比 直接 用 在 命令 行 
中 更 为 有 用 。 它 的 许多 特性 与 系统 存储 小 块 数据 以 及 给 每 个 小 块 数据 命名 的 
性 能 有 关 。 很 多 这 样 的 小 块 数据 〈 称 为 变量 [variable] 会 更 合适 ) 可 用 于 扩展 。 
例如 ， 命 名 为 USER 的 变量 包含 你 的 用 户 名 ， 为 了 触发 参数 扩展 ， 并 显示 出 
USER 的 内 容 ， 你 可 以 进行 如 下 操作 。 
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[meelinuxbox ~]$ echo $USER 
me 


想 要 查看 可 用 的 变量 列表 ， 试 试 如 下 操作 。 


[meelinuxbox ~]$ printenv | less 

你 可 能 已 经 注意 到 ,对 于 其 他 的 扩展 类 型 来 说 ， 如 果 你 误 输 入 了 一 个 模式 ， 
就 不 会 发 生 扩 展 ， 这 时 echo 命令 将 只 是 显示 这 些 误 输入 的 模式 信息 。 但 是 对 于 
参数 扩展 来 说 ， 如 果 变 量 名 拼写 错误 ， 仍 然 会 进行 扩展 ， 只 不 过 结果 是 输出 一 
个 空 字符 串 而 已 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo $SUER 


[meelinuxbox ~]$ 


7.1.6 ”命令 替换 
命令 替换 可 以 把 一 个 命令 的 输出 作为 一 个 扩展 模式 使 用 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo $(1s) 
Desktop Documents ls-output.txt Music Pictures Public Templates Videos 


我 最 喜欢 的 一 种 用 法 如 下 。 


[me@linuxbox ~]$ 1s -1 $(which cp) 
-rwxr-xr-x 1 root root 71516 2012-12-05 08:58 /bin/cp 


这 里 ,把 which cp 命令 的 运行 结果 作为 ls 命令 的 一 个 参数 ， 因 此 我 们 无 
需 知 道 cp 程序 所 在 的 完整 路 径 就 能 获得 cp 程序 对 应 的 列表 。 这 个 功能 并 不 
只 是 局 限于 简单 的 命令 ， 也 可 以 应 用 于 整个 管道 中 (只 不 过 只 显示 部 分 输 


出 内 容 )。 

[meelinuxbox ~]$ file $(1s /usr/bin/* | grep zip) 

/usr/bin/bunzip2: symbolic link to ‘bzip2' 

/usr/bin/bzip2: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV 


), dynamically linked (uses shared libs), for GNU/Linux 2.6.9, stripped 
/usr/bin/bzip2recover: ELF 32-bit LSB executable, Intel] 80386, version 1 
(SYSV), dynamically Linked (uses shared libs), for GNU/Linux 2.6.9, stripped 


/usr/bin/funzip: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV 
), dynamically linked (uses shared libs), for GNU/Linux 2.6.9, stripped 
/usr/bin/gpg-zip: Bourne shell script text executable 

/usr/bin/gunzip: Symbolic link to '../../bin/gunzip' 

/usr/bin/gzip: symbolic link to '../../bin/gzip' 

/usr/bin/mzip: Symbolic link to 'mtools' 


在 这 个 例子 中 ， 管 道 的 输出 为 file 命令 的 参数 列表 。 
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在 早期 的 shell 程序 中 ， 存 在 命令 蔡 换 的 另 一 种 语法 格式 ，bash 也 支持 这 种 
格式 。 它 用 反 引 号 代替 美元 符号 和 括号 ， 具 体 如 下 所 示 。 


[me@linuxbox ~]$ 1s -1 'which cp' 
-rwxr-xr-x 1 root root 71516 2012-12-05 08:58 /bin/cp 


7.2 引用 


我 们 已 经 知道 ，shell 有 多 种 方式 可 以 执行 扩展 ， 现 在 我 们 来 学 习 如 何 控制 扩 
展 。 先 看 下 面 的 例子 。 


[me@linuxbox ~]$ echo this is a test 
this is a test 


再 看 这 个 例子 。 


[me@linuxbox ~]$ echo The total is $100.00 
The total is 00.00 


在 第 一 个 例子 中 ，shell 会 对 echo 命令 的 参数 列表 进行 单词 分 割 (word spliting)， 
去 除 多 余 的 空白 。 在 第 二 个 例子 中 ， 因 为 $1 是 一 个 未 定义 的 变量 ， 所 以 参数 扩 
展 将 把 $1 的 值 替换 为 空 字符 串 。shell 提供 了 一 种 称 为 引用 〈quoting) 的 机 制 ， 
用 来 有 选择 性 地 避免 不 想 要 的 扩展 。 


7.2.1 双 引 号 


我 们 要 看 的 第 一 种 引用 类 型 是 双 引 号 (double quote)。 如 果 把 文本 放 在 双 引 
号 中 ， 那 么 shell 使 用 的 所 有 特殊 字符 都 将 失去 它们 的 特殊 含义 ， 而 被 看 成 普通 
字符 。 字 符 “$”( 美 元 符号 )、“\”( 反 斜 杠 )、“””( 反 引号 ) 除外 。 这 就 意味 着 
单词 分 割 、 路 径 名 扩展 、 波 浪 线 扩展 和 花 括号 扩展 都 将 失效 ， 但 是 参数 扩展 、 
算术 扩展 和 命令 替换 仍然 生效 。 使 用 双 引 号 能 够 处 理 文件 名 中 包含 空白 的 情况 。 
假设 不 幸 地 有 一 个 名 为 two words.txt 的 文件 ， 如 果 在 命令 行 中 使 用 该 文件 名 ， 
那么 单词 分 割 功能 将 把 它 当 成 两 个 独立 的 参数 ， 而 不 是 当成 我 们 希望 的 单个 参 
数 ， 具 体 运行 结果 如 下 所 示 。 

[meelinuxbox ~]$ ls -1 two words.txt 


ls: cannot access two: No such file or directory 
ls: cannot access words.txt: No such file or directory 


使 用 双 引 号 可 以 阻止 单词 分 割 ， 得 到 预期 的 结果 。 另 外 ， 使 用 双 引 号 甚至 
可 以 修复 破损 的 文件 名 ， 参 见 下 面 的 例子 。 
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[me@linuxbox ~]$ ls -1 “two words.txt" 
-rw-rw-r-- 1 me me 18 2012-02-20 13:03 two words.txt 
[meelinuxbox ~]$ mv "two words.txt" two_words.txt 


看 ! 现在 我 们 就 不 需要 一 直 输 入 那些 让 人 讨厌 的 双 引 号 了 。 
请 记 住 ， 参 数 扩展 、 算 术 扩 展 和 命令 替换 在 双 引 号 中 依然 生效 ; 


[meelinuxbox ~]$ echo “$USER $((2+2)) $(cal)" 
me 4 February 2012 
Su Mo Tu We Th Fr Sa 
1 2 3 4 

5 6 7 8 91011 

12 13 14 15 16 17 18 

19 20 21 22 23 24 25 
26 27 28 29 


接 下 来 ， 让 我 们 看 看 双 引 号 对 字符 替换 的 影响 。 我 们 首先 深入 了 解 一 下 单 
词 分 割 是 怎么 工作 的 。 在 前 面 的 例子 中 ， 我 们 已 经 看 到 单词 分 割 去 除 文本 中 多 
余 空 白 的 情况 ， 如 下 所 示 。 


[meelinuxbox ~]$ echo this is a test 
this is a test 


默认 情况 下 ， 单 词 分 割 会 先 查找 是 否 存 在 空格 、 制 表 符 以 及 换行 “换行 字 
符 )， 然后 把 它们 当 作 单词 见 的 界定 符 (delimiter)。 这 就 意味 着 没有 用 引号 包含 
起 来 的 空格 、 制 表 符 和 换行 字符 都 不 会 被 当成 文本 的 一 部 分 ， 而 只 是 被 当成 分 
割 符 。 因 为 它们 把 这 些 单词 分 割 成 不 同 的 参数 ， 所 以 例子 中 的 命令 行 被 识别 为 
命令 后 面 跟着 4 个 不 同 的 参数 。 但 是 如 果 加 上 双 引 号 ， 单 词 分 割 功 能 将 失效 ， 
嵌入 的 空格 将 不 再 被 当成 界定 符 ， 而 是 被 当成 参数 的 一 部 分 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo "this is a test” 
this is a test 


一 旦 加 上 有 双 引 号 ， 那 么 命令 行将 被 识别 为 命令 后 面 只 跟着 一 个 参数 。 


单词 分 割 机 制 会 把 换行 字符 当成 界定 符 ， 这 一 点 在 命令 替换 时 将 会 产生 微 
妙 有 趣 的 效果 。 参 考 下 面 的 例子 。 


[meelinuxbox ~]$ echo $(cal) 
February 2012 Su Mo Tu We Th Fr Sa123456789101112131415 16 17 
18 19 20 21 22 23 24 25 26 27 28 29 
[me@linuxbox ~]$ echo "$(cal)” 
February 2012 

Su Mo TU We Th Fr Sa 

1 2 3 4 
5 6 7 8 910 1 
12 13 14 15 16 17 18 
19 20 21 22 23 24 25 
26 27 28 29 
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在 第 一 个 例子 中 ， 没 有 加 上 引号 的 命令 蔡 换 将 导致 命令 行 被 识别 为 命令 后 
面 跟着 38 个 参数 ， 而 在 第 二 个 例子 中 加 了 双 引 号 ， 使 得 命令 行 被 识别 为 命令 后 
面 只 跟 一 个 参数 ， 这 个 参数 包含 着 嵌入 空格 和 换行 字符 。 


7.2.2 单 引号 


如 果 我 们 希望 抑制 所 有 的 扩展 ， 那 么 应 使 用 单 引 号 。 下 面 是 不 使 用 引号 、 
使 用 双 引 号 和 使 用 单 引 号 的 情况 对 比 。 


[meelinuxbox ~]$ echo text ~/°*.txt {a,b} $(echo foo) $((2+2)) $USER 
text /home/me/ls-output.txt a b foo 4 me 


[meelinuxbox ~]$ echo "text ~/e .txt {a,b} $(echo foo) $((2+2)) $USER" 
text ~/*.txt {a,b} foo 4 me 


[me@linuxbox ~]$ echo 'text 一 /e .txt {a,b} $(echo foo) $((2+2)) $USER' 
text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER 


可 以 看 到 ， 随 着 引用 级 别 的 加 强 ， 越 来 越 多 的 扩展 将 被 抑制 。 


7.2.3 ” 转 义 字符 


有 时 候 我 们 只 是 想 要 引用 单个 字符 。 这 种 情况 可 以 通过 在 该 字符 前 加 上 反 
斜 杠 来 实现 。 这 里 的 反 斜 杠 称 为 转 义 字符 。 转 义 字 符 经 常 在 双 引 号 中 用 来 有 选 
择 性 地 阻止 扩展 。 如 下 所 示 。 


[me@linuxbox ~]$ echo "The balance for user $USER is: \$5.00" 
The balance for user me is: $5.00 


转 义 字符 也 常用 来 消除 文件 名 中 某 个 字符 的 特殊 含义 。 比 如 ， 文 件 名 中 可 
以 使 用 在 shell 中 通常 具有 特殊 含义 的 字符 。 这 些 字 符 包 括 “$”“!”、“&&”、 空 
格 等 。 要 想 在 文件 名 中 包含 特殊 字符 ， 可 执行 如 下 操作 。 


[me@linuxbox ~]$ mv bad\&filename good filename 


如 果 想 要 显示 反 斜 杠 字符 ， 可 以 通过 使 用 两 个 反 斜 枉 “N” 来 实现 。 需 要 注 
意 的 是 ， 单 引号 中 的 反 斜 杠 将 失去 它 的 特殊 含义 ， 而 只 是 被 当成 一 个 普通 字符 。 


反 斜 杠 转 义 字符 序列 (BLACKSLASH ESCAPE SEQUENCES) 

反 斜 杠 除了 作为 转 义 字符 外 ， 也 是 一 种 表示 法 的 一 部 分 ， 这 种 表示 法 代 
表 称 为 控制 码 的 菜 些 特殊 字符 。ASCII 码 表 的 前 32 个 字符 用 来 向 电 传 打字 类 
设备 传送 命令 。 其 中 有 一 些 控 制 码 很 常见 (比如 制 表 符 、 退 格 符 、 换 行 符 和 
回 车 符 )， 但 是 其 他 的 都 不 太 常 见 ( 空 字 符 、 结 束 符 和 确认 符 )， 如 表 7-2 
所 示 。 
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表 7-2 反 儿 村 转 义 字符 序列 


转 义 字符 2 

a “ 响 铃 〈 警 告 声 一 计算 机 发 出 呼 哗 声 ) 

\b 退 格 

un 新 的 一 行 〈 在 类 UNIX 系统 中 ， 产 生 的 是 换行 效果 ) 
Yr 回 车 

\t “” 制 表 


表 中 列 出 了 一 些 常用 的 反 斜 杠 转 义 字符 序列 。 使 用 反 斜 杠 来 表示 转 义 字 
符 表示 的 理解 来 源 于 C 语言 ， 其 他 语言 也 采用 了 这 种 表示 方法 ， 包 括 shell. 

在 echo 命令 中 带 上 -e 选项 ， 就 能 够 解释 转 义 字符 序列 。 也 可 以 将 其 放 在 “$ 
5” 中。 在 下 面 的 例子 中 ， 只 需要 使 用 sleep 命令 ( 它 是 一 个 简单 的 程序 ， 在 
等 待 指定 的 秒 数 之 后 就 会 退出 )， 就 可 以 创建 一 个 简单 的 倒计时 的 计时 器 : 


Sleep 10; echo -e "Time's UpP\a” 
也 可 以 这 样 做 : 


sleep 10; echo "Time's up" $'\a' 


7.3 本章 结 尾 语 


随 着 我 们 输入 学 习 shell， 就 会 发 现 扩展 和 引用 的 使 用 频率 逐渐 多 起 来 ， 所 
以 我 们 有 必要 很 好 地 理解 它们 的 工作 方式 。 事实 上 , 甚至 可 以 说 它们 是 shell 中 最 
重要 的 主题 。 如 果 不 能 正确 地 理解 扩展 ， 那 么 shell 将 会 一 直 是 个 神秘 和 让 人 困 
惑 的 资源 ， 它 的 潜在 能 力也 就 被 浪费 了 。 


8 。 


高 级 键盘 技巧 


我 经 常 将 UNIX 戏称 为 “ 它 是 为 喜欢 敲 键盘 的 人 设计 的 操作 系统 ”。 当 然 ， 
UNIX 中 存在 命令 行 的 这 一 事实 充分 证 明了 这 点 。 但 是 用 户 使 用 命令 行 时 往往 不 
喜欢 融入 太 多 字 ， 所 以 命令 中 存在 很 多 类 似 cp、ls、mv 和 rm 的 短命 令 。 


事实 上 ， 省 事 〈laziness)〈 即 用 最 少 的 击 键 次 数 执行 最 多 的 任务 》 是 命令 行 最 希 
望 达到 的 目标 之 一 。 命 令 行 的 另 一 个 目标 是 ， 用 户 在 执行 任务 时 手指 无 需 离开 键 
盘 ， 用 不 使 用 鼠标 。 本 章 我 们 将 学 习 可 以 令 键盘 使 用 得 更 快 和 更 高 效 的 bash 功能 。 


我 们 将 使 用 到 以 下 命令 。 
e clear: 清 屏 。 
。 history: 显示 历史 列表 的 记录 。 


8.1 编辑 命令 行 


bash 使 用 了 一 个 名 为 Readline 的 库 ( 供 不 同 的 应 用 程序 共享 使 用 的 线程 集合 ) 
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来 实现 命令 行 的 编辑 。 在 前 面 我 们 曾 提 到 过 相关 内 容 。 比 如 ， 通 过 箭头 键 移动 
光标 。 除 此 之 外 ，bash 还 有 很 多 其 他 的 功能 ， 它 们 可 以 当 作 在 工作 中 使 用 的 附 
加 工具 。 虽 然 并 不 要 求 你 们 学 会 所 有 的 这 些 功能 ， 但 是 学 会 其 中 的 一 些 功 能 还 
是 非常 有 用 的 。 请 选择 自己 需要 的 功能 。 


直面 的 有 些 组 合 键 (尤其 对 于 那些 使 用 了 Alt 键 的 组 合 键 ) 可 能 会 被 GUI 


注意 
(图 形 用 户 界 面 ) 识别 为 其 他 功能 。 当 使 用 虚拟 控制 台 时 ， 所 有 的 组 合 键 应 该 
能 够 正常 工作 。 
8.1.1 光标 移动 
表 8-1 中 列 出 了 用 来 移动 光标 的 组 合 键 。 
表 8-1 光标 移动 命令 
组 合 键 作用 
Ctrl-A 移动 光标 到 行 首 
Ctrl-E 移动 光标 到 行 尾 
Ctrl-F 光标 向 前 移动 一 个 字符 ， 和 右 箭 头 键 作用 一 样 
Ctrl-B 光标 向 后 移动 一 个 字符 ， 和 左 箭头 键 作 用 一 样 
Alt-F 光标 向 前 移动 一 个 字 
Alt-B 光标 向 后 移动 一 个 字 
Ctrl-L 清 屏 并 把 光标 移 到 左上 角 ;， clear 命令 可 以 完成 相同 的 工作 
8.1.2 ”修改 文本 


表 8-2 列 出 了 用 来 编辑 命令 行 字符 的 键盘 指令 。 
表 8-2 文本 编辑 命令 


组 合 键 作用 

Ctrl-D 删除 光标 处 的 字符 

Ctrl-T 使 光标 处 的 字符 和 它 前 面 的 字符 对 调 位 置 
Alt-T 使 光标 处 的 字 和 它 前 面 的 字 对 调 位 置 


把 从 光标 到 字 尾 的 字符 转换 成 小 写字 母 形式 
把 从 光标 到 字 尾 的 字符 转换 成 大 写字 母 形式 


Alt-L 
Alt-U 
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8.1.3 ”前 切 和 粘贴 ( Killing and Yanking ) 文本 


Readline 文档 中 使 用 术语 killing 和 yanking 来 指 代 通常 所 说 的 前 切 和 粘贴 。 
表 8-3 列 出 了 用 来 前 切 和 粘贴 的 命令 。 被 前 切 的 内 容 存 放 在 一 个 称 为 kill-ring 的 


缓冲 区 中 。 
表 8-3 ”前 切 和 粘贴 命令 
组 合 键 作用 ， 
CrLK 剪 切 从 光标 到 行 尾 的 文本 
Ctrl-U 前 切 从 光标 到 行 首 的 文本 
Alt-D 前 切 从 光标 到 当前 词尾 的 文本 
Al 前 切 从 光标 到 词 头 的 文本 。 如 果 光标 在 一 个 单词 的 开头 ， 则 剪 切 前 一 个 
t-Backspace 单词 
Ctrl-Y 把 kill-ring 缓冲 区 中 的 文本 粘贴 到 光标 位 置 
元 键 


在 4 帮助 文档 的 “READLINE” 部 分 可 以 查看 Readline 文档 ， 0 
你 将 会 看 到 元 键 (meta key ) 这 个 术语 。 它 对 应 于 现代 键盘 中 的 Alt 键 ,不 
也 并 不 总 是 这 样 。 

回 到 混沌 时 代 (PC 时 代 前 ，UNIX 时 代 后 )， 并 不 是 每 个 人 都 有 自己 的 计 
算 机 。 当 时 的 用 户 可 能 只 有 一 台 称 为 终端 的 设备 。 终 端 是 一 种 通信 设备 ， 它 
包含 一 个 文本 显示 屏 、 一 个 键盘 以 及 一 些 用 来 显示 文本 字符 和 移动 光标 的 电 
子 器 件 。 终 端 (通常 通过 串 行 电 缆 ) 连接 到 一 台大 型 计算 机 或 者 大 型 计算 机 
通信 网 。 它 有 很 多 不 同 的 品牌 ， 因 此 有 不 同 的 键盘 和 不 同 的 显示 特性 集 。 由 
于 它们 至 少 都 能 识别 ASCII 码 ， 因 此 软件 开发 者 想 要 编写 符合 最 低 标准 的 可 
移植 的 应 用 程序 。UNIX 系统 有 一 套 非 常 巧 妙 的 方法 来 处 理 这 些 终端 以 及 它们 
不 同 的 显示 特性 。 因 为 Readline 的 开发 者 们 不 能 确定 是 否 存 在 一 个 专门 的 附 
加 控制 键 ， 所 以 他 们 发 明了 一 个 ， 并 把 它 称 之 为 “元 ”。 现 代 键 盘 上 的 Alt 键 
相当 于 元 键 。 如果 你 仍然 在 使 用 终端 ， 则 按 下 和 释放 Esc 键 和 长 按 住 Alt 键 的 
效果 是 相同 的 (对 于 Linux 系统 也 是 如 此 )。 


8.2 自动 补 齐 功能 
shell 的 一 种 称 为 “自动 补 齐 ”的 机 制 为 用 户 提供 了 很 大 的 帮助 。 在 输入 命 
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。 令 时 ， 按 Tab 键 将 触发 自动 补 齐 功 能 。 下 面 让 我 们 看 看 它 是 如 何 工作 的 。 假 设 
用 户 目 录 如 下 。 


[me@linuxbox ~]$ 1s 


Desktop ls-output.txt Pictures Templates Videos 
Documents Music Public 


输入 如 下 命令 ， 但 是 不 要 按 Enter 键 。 
[me@linuxbox ~]$ ls 1 

此 时 按 Tab 键 : 
[meelinuxbox ~]$ 1s ls-output.txt 

观察 shell 是 如 何 补 齐 这 一 行 的 。 再 看 另 一 个 例子 , 同样 , 也 不 要 按 Enter 键 。 
[me@linuxbox -]$ ls D 


按 下 Tab 键 : 


[meelinuxbox ~]$ 1s D . 

没有 自动 补 齐 一 一 只 有 哗 哗 声 。: 这 是 因为 字母 D 和 目录 中 一 个 以 上 的 名 称 
匹配 。 要 让 自动 补 齐 功能 生效 ， 要 保证 输入 的 内 容 不 模棱两可 ， 即 必须 是 确定 
性 的 。 如 果 我 们 继续 输入 : 


[me@linuxbox ~]$ 1s Do 
此 时 按 下 Tab: 
{me@linuxbox ~}$ ls Documents 
自动 补 齐 功 能 这 次 生效 了 。 
这 个 例子 给 出 的 是 路 径 名 的 自动 补 齐 ， 这 也 是 最 常用 的 方式 。 自 动 补 齐 也 
可 以 针对 变量 《如 果 单 词 以 $ 开 头 )、 用 户 名 〈 如 果 单 词 以 一 开头 )、 命 令 〈 如 果 
单词 是 命令 行 的 第 一 个 单词 ) 和 主机 名 《如 果 单 词 以 @ 开 头 ) 起 作用 。 主 机 名 
的 自动 补 齐 只 对 /etc/hosts 目录 下 的 主机 名 生效 。 
有 一 些 控制 和 元 键 序列 与 自动 补 齐 功能 相关 联 ( 见 表 8-4)。 
表 8-4 自动 补 齐 命令 
组 合 键 作用 


Altg 显示 所 有 可 能 的 自动 补 齐 列表 。 在 大 多 数 系统 中 ， 可 通过 按 两 次 Tab 
键 实现 ， 而 且 也 会 更 容易 一 些 


Alt-* 插入 所 有 可 能 的 匹配 项 。 当 需要 用 到 一 个 以 上 的 匹配 项 时 ， 将 比较 有 用 
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除了 以 上 这 些 , 还 有 相当 多 的 组 合 键 ， 可 以 在 bash man 页 面 的 READLINE 
部 分 获取 更 多 的 相关 内 容 列表 。 


可 编程 的 自动 补 齐 

bash 的 当前 版 本 提供 了 一 种 称 为 “可 编程 的 自动 补 齐 ”的 工具 。 可 编程 
自动 补 齐 允许 用 户 ( 更 可 能 是 发 行 版 本 提供 商 ) 添加 附加 的 自动 补 齐 规则 。 
一 般 来 说 ， 这 样 做 是 为 了 支持 特定 的 应 用 。 例 如 ， 可 以 为 一 个 命令 的 可 选 列 
表 ， 或 者 是 为 了 匹配 某 种 应 用 支持 的 特定 的 文件 类 型 ， 而 添加 自动 补 齐 。 黑 
认 情 况 下 ，Ubuntu 定义 了 一 个 相当 大 的 规则 集合 。 可 编程 自动 补 齐 通过 shell 
函数 来 实现 的 ，shell 函数 是 一 种 小 型 shell wa 这 个 将 在 后 面 的 章节 介绍 。 
如 果 你 好 奇 的 话 ， 试 一 下 


set | less 


看 看 是 否 可 以 找到 它们 。 默认 情况 下 ， 并 不 是 所 有 的 发 行 版 本 都 包含 它们 .。 


8.3 ”使 用 历史 命令 


第 1 章 我 们 已 经 提 到 ，bash 会 保存 使 用 过 命令 的 历史 记录 。 这 些 命 令 的 历 
史记 录 列 表 保 存在 用 户主 目录 的 .bash_history 文件 中 。 这 些 历史 记录 非常 有 用 ， 
可 以 大 大 减少 用 户 敲打 键盘 的 次 数 ， 特 别 是 和 命令 行 编辑 结合 使 用 的 时 候 。 


8.3.1 搜索 历史 命令 
任何 情况 下 ， 我 们 都 可 以 通过 如 下 命令 查看 历史 记录 的 内 容 列 表 。 


[me@linuxbox -]$ history | less 


bash 默认 会 保存 用 户 最 近 使 用 过 的 500 个 命令 。 其 中 ，500 是 个 默认 值 ， 
关于 如 何 改变 这 个 默认 值 将 在 第 11 章 介 绍 。 假设 我 们 想 找到 用 来 列 出 /usr/bin 
目录 下 内 容 的 命令 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ history | grep /usr/bin 
假设 得 到 的 搜索 结果 中 有 一 行 包含 如 下 有 趣 的 命令 。 
88 ls -1 /usr/bin > ls-output.txt 


数字 88 表示 这 个 命令 行 在 历史 记录 列表 中 所 处 的 行 号 , 我 们 可 以 通过 使 用 
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名 为 历史 记录 扩展 (history expansion) 的 扩展 类 型 来 立即 使 用 它 。 为 了 使 用 我 
们 发 现 的 命令 行 ， 可 以 如 下 操作 : . 


[meelinuxbox ~]$ 188 


bash 将 把 188 扩展 为 历史 列表 中 第 88 行 的 内 容 。 稍 后 将 介绍 历史 记录 扩展 
的 其 他 形式 。 


bash 也 支持 以 递增 方式 搜索 历史 记录 。 也 就 是 说 ， 当 搜索 历史 记录 时 ， 随 
着 输入 字符 数 的 增加 ，bash 会 相应 地 改变 搜索 范围 。 按 下 CtrlL-R 键 ， 接 着 输入 
你 要 查找 的 内 容 ， 可 以 开始 递增 式 的 搜索 。 当 找到 要 查找 的 内 容 时 ， 按 Enter 
键 表示 执行 此 命令 ， 而 按 Ctrl-J 将 把 搜索 到 的 内 容 从 历史 记录 列表 中 复制 到 当前 
命令 行 。 当 要 查找 下 一 个 匹配 项 时 ( 即 向 前 搜索 历史 记录 ), 再 次 按 下 Ctrl-R 键 。 
若 要 退出 搜索 ， 按 下 Ctrl-G 或 者 Ctrl-C 即 可 。 请 看 下 面 的 例子 。 


[me@linuxbox ~-]$ 
首先 按 下 Ctrl-R。 


(reverse-i-search) ‘'' 


提示 符 发 生 改变 ， 提 示 正 在 进行 逆向 递增 式 搜索 。 称 为 “逆向 ”是 因为 查 
找 的 是 从 “现在 ”到 过 去 的 某 个 时 间 之 间 的 操作 。 接 下 来 ， 输 入 要 查找 的 内 容 ， 
这 个 例子 中 是 查找 /usr/bin。 


(reverse-i-search) ‘/usr/bin': 1ls -1 /usr/bin > ls-output.txt 


很 快 搜索 操作 返回 了 结果 。 此 时 我 们 可 按 Enter 键 执行 搜索 结果 ,也 可 按 下 
Ctrl-J 把 搜索 结果 复制 到 当前 命令 行 以 便 作 进一步 的 编辑 。 假 定 按 下 Ctrl-J]， 把 
搜索 结果 复制 到 当前 命令 行 。 


[meelinuxbox ~]$ ls -1 /usr/bin > ls-output.txt 
shell 将 实时 响应 ， 命 令 行 将 被 加 载 ， 准 备 运行 。 
表 8-5 列 出 了 一 些 用 来 手动 操作 历史 记录 的 组 合 键 。 
表 8-5 历史 记录 命令 


组 合 键 作用 

Ctrl-P 移动 到 前 一 条 历史 记录 。 相 当 于 向 上 第 头 键 
Ctrl-N 移动 到 后 一 条 历史 记录 。 相 当 于 向 下 箭头 键 
Alt-< 移动 到 历史 记录 列表 的 开始 处 


Alt-> 移动 到 历史 记录 列表 的 结尾 处 。 即 当前 命令 行 
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续 表 
组 合 键 作用 
Ctrl-R 逆向 递增 地 搜索 。 从 当前 命令 行 向 前 递增 搜索 
太守 市 逆向 非 递增 地 搜索 。 按 下 这 个 组 合 键 ， 接 着 输入 待 搜索 的 字符 串 ， 在 按 
Enter 键 后 ， 搜 索 才 真正 开始 执行 
Alt-N 向 前 非 递增 地 搜索 
BLO 执行 历史 记录 列表 中 的 当前 项 ， 执 行 完 跳 到 下 一 项 。 若 训 把 历史 记录 中 
的 一 系列 命令 重新 执行 一 遍 ， 使 用 该 组 合 键 将 很 方便 


8.3.2 ”历史 记录 扩展 

shell 提供 了 一 种 专门 用 来 扩展 历史 记录 项 的 方式 一 一 使 用 ! 字 符 。 前面 我 们 
曾 提 到 过 如 何 通过 在 感叹 号 后 面 跟 数字 的 方式 ， 将 来 自 历史 记录 列表 中 的 命令 
插入 到 命令 行 中 。 除 了 这 种 方式 ， 还 有 很 多 其 他 的 扩展 特性 ( 见 表 8-6)。 

当 使 用 “! string” 和 “! ? string” 时 ， 请 务必 小 心 谨慎 ， 除 非 对 历史 记录 
中 的 内 容 非 常 确信 。 

历史 记录 扩展 机 制 中 还 有 很 多 其 他 的 可 用 特点 , 但 是 该 主题 太 过 星 汲 难 懂 ， 
此 处 不 再 讨论 。 你 可 以 查阅 bash 帮助 页 面 中 的 “HISTORY EXPANSION” 部 分 


获取 更 多 细节 。 
表 8-6 历史 记录 扩展 命令 
序列 行为 
ji 重复 最 后 一 个 执行 的 命令 。 按 向 上 箭头 键 再 按 Enter 键 也 可 实现 相同 的 
四 功能 ， 而 且 操 作 更 简单 
tnumber 重复 历史 记录 中 第 number 行 的 命令 
! string 重复 最 近 的 以 string 开头 的 历史 记录 
l9string 重复 最 近 的 包含 string 的 历史 记录 


脚本 
除了 bash 中 的 命令 历史 特性 外 ， 大 部 分 Linux 发 行 版 本 都 包含 一 个 称 为 
脚本 (script ) 的 程序 ， 它 记录 了 shell 的 整个 会 话 ， 并 且 将 会 话 保存 到 一 个 文 
件 中 。 该 命令 的 基本 语法 是 : 
script {file] 
其 中 file 为 用 来 保存 会 话 记录 的 文件 名 。 如 果 没 有 指定 文件 ， 默 认 使 用 
文件 typescript。 脚本 (script ) 的 man 页 面 给 出 了 该 程序 的 所 有 可 选项 和 特性 。 
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8.4 本 章 结尾 语 


本 章 介绍 了 shell 提供 的 一 些 键盘 操作 技巧 ， 它 们 能 够 帮助 打字 员 减 少 工作 
量 。 随 着 时 间 的 推移 ， 你 会 越 来 越 多 地 接触 到 命令 行 ， 到 时 候 你 会 翻阅 这 一 章 
的 内 容 ， 以 获得 更 多 的 键盘 使 用 技巧 。 当 前 ， 只 需 将 它们 当做 一 个 虽然 有 用 但 
是 当前 没有 必要 掌握 的 可 选 技能 即 可 。 


第 章 
权 限 


传统 的 UNIX 操作 系统 与 那些 传统 的 MS-DOS 操作 系统 不 同 ， 区 别 在 于 
它们 不 仅 是 多 重任 务 处 理 〈multitasking〉 系统， 而 且 还 是 多 用 户 《multiuser) 
系统 。 

确切 地 说 ， 这 意味 着 什么 呢 ? 这 意味 着 同一 时 间 内 可 以 有 多 个 用 户 使 用 同 
一 台 计 算 机 。 虽 然 一 台 标 准 的 计算 机 可 能 只 包含 一 个 键盘 和 一 台 显示 器 ， 但 是 
它 仍然 可 以 同时 被 一 个 以 上 的 用 户 使 用 。 例 如 ， 如 果 计 算 机 连接 到 一 个 网 络 或 
者 互联 网 中 ， 远 程 用 户 可 以 通过 ssh (安全 shell) 登录 并 且 操 作 这 人 台 计 算 机 。 
事实 上 , 远程 用 户 可 以 执行 图 形 化 应 用 程序 , 而 且 图 形 化 的 输出 结果 将 会 出 现 
在 远程 显示 器 上 。X 窗口 系统 把 这 个 作为 基本 设计 理念 的 一 部 分 ， 并 支持 这 种 
功能 。 

Linux 的 多 用 户 功 能 并 不 是 最 近 的 “创新 ” 而 是 深 嵌 在 操作 系统 设计 理念 
中 的 一 个 特色 功能 。 想 想 UNIX 系统 诞生 时 的 背景 环境 ， 该 功能 的 出 现 有 着 重 
大 的 意义 。 很 多 年 前 ， 在 计算 机 “个 人 化 ”之 前 ， 计 算 机 普遍 体积 大 ， 价 格 昂 
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贵 ， 而 且 都 是 集中 控制 的 。 例 如 ， 一 个 典型 的 校园 计算 机 系统 ， 是 由 一 台 放 置 
在 某 建筑 物 中 的 大 型 中 央 计 算 机 以 及 遍布 校园 的 各 人 台 终 端 机 组 成 的 ， 每 台 终端 
机 都 连接 到 中 央 计 算 机 上 。 这 台中 央 计 算 机 可 以 同时 支持 很 多 用 户 。 


为 了 保证 多 用 户 功 能 实际 可 用 ， 系 统 特别 设计 了 一 种 方案 来 保护 当前 用 户 
不 受 其 他 用 户 操作 的 影响 。 毕 竞 ， 一 个 用 户 的 操作 不 能 导致 计算 机 崩 演 ， 一 个 
用 户 的 操作 界面 也 不 能 显示 属于 另 一 个 用 户 的 文件 。 


本 章 将 介绍 系统 安全 的 基础 知识 以 及 如 下 命令 的 使 用 。 
。 id: 显示 用 户 身 份 标识 。 
。 chmod: 更 改 文件 的 模式 。 
。 umask: 设置 文件 的 默认 权限 。 
。 su: 以 另 一 个 用 户 的 身份 运行 shell。 
。 sudo: 以 另 一 个 用 户 的 身份 来 执行 命令 。 
。 chown: 更 改 文件 所 有 者 。 
。 chgrp: 更 改 文件 所 属 群 组 。 
。 passwd: 更 改 用 户 密码 。 


9.1 所 有 者 、 组 成 员 和 其 他 所 有 用 户 


我 们 在 第 4 章 讲解 文件 系统 时 ， 当 试图 查看 类 似 /etc/shadow 的 文件 时 ， 会 
过 到 下 面 的 问题 。 
[me@linuxbox ~]$ file /etc/shadow 
/etc/shadow: regular file, no read permission 


[me@linuxbox ~]$ less /etc/shadow 
/etc/shadow: Permission denied 


产生 这 种 错误 信息 的 原因 是 , 作为 一 个 普通 用 户 , 没有 读 取 这 个 文件 的 权限 。 


在 UNIX 安全 模型 中 ， 一 个 用 户 可 以 拥有 (own) 文件 和 目录 。 当 一 个 用 户 
拥有 一 个 文件 或 者 目录 时 ， 它 将 对 该 文件 或 目录 的 访问 权限 拥有 控制 权 。 反 过 
来 ， 用 户 又 归属 于 一 个 群 组 (group)， 该 群 组 由 一 个 或 者 多 个 用 户 组 成 ， 组 中 
用 户 对 文件 和 目录 的 访问 权限 由 其 所 有 者 授予 。 除 了 可 以 授予 群 组 访问 权限 之 
外 ， 文 件 所 有 者 也 可 以 授予 所 有 用 户 一 些 访问 权限 ， 在 UNIX 术语 中 ， 所 有 用 
户 是 指 整 个 世界 (world)。 使 用 id 命令 可 以 获得 用 户 身份 标识 的 相关 信息 ， 如 


9.2 
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下 所 示 。 


[meelinuxbox ~]$ id 
uid=500(me) gid=500(me) groups=500 (me) 


查看 id 命令 的 输出 结果 。 在 创建 用 户 账户 的 时 候 ， 用 户 将 被 分 配 一 个 称 为 
用 户 ID (wser ID) 或 者 uid 的 号 码 。 为 了 符合 人 们 的 使 用 习惯 ， 用 户 ID 与 用 户 
名 一 一 映射 .同时 用 户 将 被 分 配 一 个 有 效 组 ID (primary group ID ) 或 者 称 为 gid， 
而 且 该 用 户 也 可 以 归属 于 其 他 的 群 组 。 前 面 的 例子 是 在 Fedora 系统 中 运行 的 结 
果 。 在 其 他 系统 中 ， 比 如 Ubuntu 系统 ， 输 出 结果 可 能 会 有 一 些 不 同 。 
[me@linuxbox ~]$ id 
uid=1000 (me) gid=1000(me) 


groups=4(adm) ,20(dialout),24(cdrom) ,25(floppy) ,29(audio),30(dip),44{(video) ,46{ 
plugdev) ,108(1padmin) ,114(admin) ,1000{(me) 


我 们 可 以 发 现 ， 两 个 系统 中 用 户 的 uid 和 gid 号 码 是 不 同 的 。 原 因 很 简单 ， 
因为 在 Fedora 系统 中 ,普通 用 户 账 户 是 从 500 开始 编号 的 , 而 在 Ubuntu 系统 中 
则 是 从 1000 开始 编号 。 同 时 我 们 也 可 以 发 现 ,Ubuntu 系统 中 的 用 户 归属 于 更 多 
的 群 组 。 这 和 Ubuntu 系统 管理 系统 设备 和 服务 权限 的 方式 有 关 。 


那么 这 些 信息 从 何 而 来 呢 ? 类 似 于 Linux 系统 中 的 很 多 情况 ， 这 些 信 息 来 
源 于 一 系列 的 文本 文件 。 用 户 账户 定义 在 文件 /etc/passwd 中 ， 用 户 组 定义 在 文 
件 /etc/group 文件 中 。 在 创建 用 户 账户 和 群 组 时 ， 这 些 文件 随 着 文件 /etc/shadow 
的 变动 而 修改 ， 文 件 /etc/shadow 中 保存 了 用 户 的 密码 信息 。 对 于 每 一 个 用 户 账 
户 ， 文 件 /etc/passwd 中 都 定义 了 对 应 用 户 的 用 户 〈 登 录 ) 名 、uid、gid、 账 户 的 
真实 姓名 、 主 目录 以 及 登录 shell 信息 。 如 果 查 看 文件 /etc/passwd 和 文件 /etc/group 
的 内 容 ， 那 么 你 将 会 发 现 除 了 普通 用 户 账户 信息 之 外 ， 文 件 中 还 有 对 应 于 超级 
用 户 (vid 为 0) 和 其 他 不 同 种 类 的 系统 用 户 的 账户 信息 。 


在 第 10 章 中 我 们 介绍 进程 时 ， 你 将 会 发 现 这 些 其 他 的 “用 户 ” 中 有 一 些 实 
际 上 古 相当 忙碌 的 。 


许多 类 UNIX 系统 会 把 普通 用 户 分 配 到 一 个 公共 的 群 组 中 〈 比 如 ，users )， 


然而 现在 的 Linux 操作 则 是 创建 一 个 独一无二 的 ， 只 有 一 个 用 户 的 群 组 ， 而 且 


组 名 和 用 户 的 名 字 相 同 。 这 使 得 特定 类 型 的 权限 分 配 变 得 更 加 容易 。 


读 取 、 写 人 和 执行 


对 文件 和 目录 的 访问 权限 是 按照 读 访问 、 写 访问 以 及 执行 访问 来 定义 的 。 
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当 我 们 查看 lg 命令 的 输出 结果 时 ， 可 以 得 到 一 些 线索 ， 了 解 其 实现 方式 。 


[me@linuxbox ~]$ > foo.txt 
[meelinuxbox ~]$ 1s -1 foo.txt 
-MW-rw-r-- 1 me me 0 2012-03-06 14:52 foo.txt 


列 在 输出 结果 中 的 前 10 个 字符 表示 的 是 文件 属性 〈file attribute， 见 图 9-1)。 
其 中 第 一 个 字符 表示 文件 类 型 (file type)。 表 9-1 列 出 了 最 可 能 见 到 的 文件 类 型 
《还 有 其 他 的 不 常见 类 型 )。 


@ 文件 类 型 〈《 见 表 9-1) 

@ 所 有 者 权限 〈 见 表 9-2) 
全 组 权限 ( 见 表 9-2) 

人 @ 其 他 用 户 权 限 〈 见 表 9-2》 


图 9-1 文件 属性 的 分 类 


表 9-1 文件 类 型 

属性 ”文件 类 型 
- 普通 文件 
d 目录 文件 


1 符号 链接 。 注 意 对 于 符号 链接 文件 ， 剩 下 的 文件 属性 始终 是 rwxrwxrwx， 它 是 
个 伪 属 性 值 。 符 号 链接 指向 的 文件 的 属性 才 是 真正 的 文件 属性 


字符 设备 文件 。 该 文件 类 型 表示 以 字 节 流 形式 处 理 数据 的 设备 , 如 终端 或 调制 
解 调 器 

块 设备 文件 。 该 文件 类 型 表示 以 数据 块 方式 处 理 数 据 的 设备 ， 如 硬盘 驱动 或 者 

光盘 驱动 


文件 属性 中 剩 下 的 9 个 字符 称 为 文件 模式 〈file mode)， 分 别 表示 文件 所 有 
者 、 文 件 所 属 群 组 以 及 其 他 所 有 用 户 对 该 文件 的 读 取 、 写 入 和 执行 权限 。 


分 别 设置 r、w 和 x 的 模式 属性 将 会 对 文件 和 目录 带 来 不 同 的 影响 ， 如 


表 9-2 所 示 。 

表 9-2 权限 属性 

属性 文件 目录 

多 许 打开 和 污 取 文件 EAT, AR 


允许 写 入 或 者 截 短文 件 ， 如 果 也 设置 了 执 。 但 是 该 权限 不 允许 重 命名 或 者 删除 文件 。 是 


w 行 权限 ， 那 么 目录 中 的 文件 允许 被 创建 、 五 全 
ts 否 能 重 命名 和 删除 文件 由 目录 权限 决定 
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续 表 
属性 文件 目录 
允许 把 文件 当 作 程序 一 样 来 执行 。 用 脚本 
元 语言 写 的 程序 文件 必须 被 设置 为 可 读 ， 以 ”允许 进入 目录 下 ， 例 如 cd directory 
便 能 被 执行 : 
表 9-3 给 出 了 一 些 文件 属性 设置 的 例子 。 
表 9-3 权限 属性 实例 
文件 属性 含义 
ee 普通 文件 ， 文 件 所 有 者 具有 读 取 、 写 入 和 执行 权限 。 组 成 员 和 其 他 所 有 用 户 都 没 
有 任何 访问 权限 
普通 文件 ， 文 件 所 有 者 具有 读 取 和 写 入 权限 。 组 成 员 和 其 他 所 有 用 户 都 没有 任何 
Ns 访问 权限 
i 普通 文件 ， 文 件 所 有 者 具有 读 取 和 写 入 权限 。 文 件 所 有 者 所 在 群 组 的 成 员 可 以 读 
取 该 文件 。 该 文件 对 于 所 有 用 户 来 说 都 是 可 读 的 
Tat 普通 文件 ， 文 件 所 有 者 具有 读 取 、 写 入 和 执行 权限 。 其 他 所 有 用 户 也 可 以 读 取 和 
执行 该 文件 
-rw-rw--- 普通 文件 ， 只 有 文件 所 有 者 和 文件 所 有 者 所 在 群 组 的 成 员 具 有 读 取 和 执行 权限 


符号 链接 。 所 有 的 符号 链接 文件 显示 的 都 是 “ 伪 ” 权 限 属性 ， 真 正 的 权限 属性 由 
符号 链接 指向 的 实际 文件 决定 


目录 文件 。 文 件 所 有 者 和 所 有 者 所 在 群 组 的 成 员 都 可 以 进入 该 和 目录， 而 且 可 以 创 


UR 建 、 重 命名 和 删除 该 目录 下 的 文件 
目录 文件 。 文 件 所 有 者 可 以 进入 该 目录 ， 而 且 可 以 创建 、 重 命名 和 删除 该 目录 下 
de 的 文件 。 所 有 者 所 在 群 组 的 成 员 可 以 进入 该 目录 ， 但 是 不 能 创建 、 重 命名 和 删除 
该 目录 下 的 文件 


9.2.1 chmod 一 一 更 改 文件 模式 


我 们 可 以 使 用 chmod 命令 来 更 改 文件 或 者 目录 的 模式 (权限 )。 需 要 注意 的 
是 只 有 文件 所 有 者 和 超级 用 户 才 可 以 更 改 文件 或 者 目录 的 模式 。chmod 命令 支 
持 两 种 不 同 的 改变 文件 模式 的 方式 一 一 八进制 数字 表示 法 和 符号 表示 法 。 首 先 
我 们 来 学 习 八 进 制 数字 表示 法 。 


八进制 数字 表示 法 

八进制 表示 法 指 的 是 使 用 八进制 数字 来 设置 所 期 望 的 权限 模式 。 因 为 每 个 
八进制 数字 对 应 着 3 个 二 进 制 数 字 ， 所 以 这 种 对 应 关系 正好 可 以 和 用 来 存储 文 
件 模式 的 结构 方式 一 一 映射 。 表 9-4 形象 地 说 明了 这 一 点 。 
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表 9-4 以 二 进 制 和 入 进 制 方式 表示 文件 模式 


0 

1 001 X 
2 010 Wi: 

3 011 WX 
4 100 r 

5 101 rx 

6 110 rw- 
7 111 TYWX 
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可 以 用 来 表示 3 位 二 进 制 数 的 功能 是 非常 有 用 的 ， 接 下 来 我 们 将 很 快 将 可 以 
看 到 这 一 点 。 


通过 使 用 3 位 八进制 数字 ， 我 们 可 以 分 别 设置 文件 所 有 者 、 组 成 员 和 其 他 
所 有 用 户 〈world) 的 文件 模式 。 


[meelinuxbox ~]$ > foo.txt 

[me@linuxbox -~]$ 1s -1 foo .txt 

-rw-rw-r-- 1 me me 0 2012-03-06 14:52 foo.txt 
[me@linuxbox ~}$ chmod 600 foo.txt 

[me@linuxbox ~]$ 1s -1 foo.txt 

-TW------- 1ne me 0 2012-03-06 14:52 foo.txt 


通过 传递 参数 600, 我 们 可 以 设置 文件 所 有 者 具有 读 写 权限 , 而 取消 组 用 户 
和 其 他 所 有 用 户 〈world) 的 所 有 权限 。 虽 然 看 起 来 ， 要 记 住 八进制 和 二 进 制 之 
间 的 映射 关系 好 象 不 是 那么 简单 ， 但 是 实际 上 ， 常 用 的 也 就 只 有 这 几 个 而 已 : 7 
(rwx)、6 (rw-)、 5 (r-x)、 4 (r--) 和 0 (---)。 


符号 表示 法 
chmod 命令 支持 一 种 符号 表示 法 来 指定 文件 模式 。 该 符号 表示 法 分 为 三 部 
分 : 更 改 会 影响 谁 、 要 执行 哪个 操作 以 及 要 设置 哪 种 权限 。 可 以 通过 字符 u、g 
o 和 a 的 组 合 来 指定 要 影响 的 对 象 ， 如 表 9-5 所 示 。 
表 9-5 chmod 命令 符号 表示 法 


符号 含义 

u user 的 简写 ， 表 示 文 件 或 者 目录 的 所 有 者 
g 文件 所 属 群 组 

o others 的 简写 ， 表 示 其 他 所 有 用 户 

a all 的 简写 ， 是 ‘u', ‘g*? 和 *o’ 三 者 的 组 合 


如 果 没 有 指定 字符 ， 则 假定 使 用 all。 操 作 符 “+” 表 示 添 加 一 种 权限 ,， “一” 
表示 删除 一 种 权限 ,“=” 表 示 只 有 指定 的 权限 可 用 ， 其 他 所 有 的 权限 都 被 删除 。 


权限 由 字符 “r”“w” 和 “x” 来 指定 。 表 9-6 列 出 了 一 些 符 号 表示 法 的 实例 。 
表 9-6 chmod 命令 符号 表示 法 实例 


符号 含义 
utx 为 文件 所 有 者 添加 可 执行 权限 
Ux 删除 文件 所 有 者 的 可 执行 权限 


+x 为 文件 所 有 者 、 所 属 群 组 和 其 他 所 有 用 户 添加 可 执行 权限 ， 等 价 于 atx 
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续 表 

符号 含义 
o-rw 除了 文件 所 有 者 和 所 属 群 组 之 外 ， 删 除 其 他 所 有 用 户 的 读 写 权限 

除了 文件 所 有 者 之 外 ,设置 所 属 群 组 和 其 他 所 有 用 户 具有 读 写 权限 。 如 
go=rw 果 所 属 群 组 或 者 其 他 所 有 用 户 之 前 已 经 具有 可 执行 权限 ， 那 么 删除 他 们 

的 可 执行 权限 
a 为 文件 所 有 者 添加 可 执行 权限 ,同时 设置 所 属 群 组 和 其 他 所 有 用 户 具有 

4 读 权 限 和 可 执行 权限 。 指 定 多 种 权限 时 ， 需 用 逗号 分 隔 


有 些 人 喜欢 使 用 八进制 表示 法 ， 而 有 些 人 则 真 的 很 喜欢 用 符号 表示 法 。 符 
号 表示 法 的 优点 在 于 允许 设置 单个 属性 ， 而 不 影响 其 他 的 任何 属性 。 

我 们 可 以 查看 chmod 命令 的 帮助 页 面 , 以 获取 更 多 的 细节 内 容 和 选项 信息 。 
关于 --recursive 选项 ， 我 们 需要 注意 ， 它 对 文件 和 目录 都 起 作用 ， 所 以 该 选项 并 
不 如 想象 中 的 那么 有 用 ， 因 为 用 户 很 少 会 想 要 给 文件 和 目录 设置 相同 的 权限 。 


9.2.2 采用 GUI 设置 文件 模式 
现在 ,我 们 已 经 知道 了 如 何 设置 文件 和 目录 的 权限 ， 这 样 就 可 以 更 好 地 理 
解 GUI 中 的 设置 权限 对 话 框 了 。 在 Nautilus (GNOME 桌面 系统 ) 和 Konqueror 
(KDE 桌面 系统 ) 中 ， 右 击 文件 或 者 目录 图 标 都 将 会 弹出 一 个 属性 对 话 框 。 图 9-2 
是 KDE 3.5 环境 下 运行 的 一 个 例子 。 


< Properties for pws-read- ? 口 X 


Others: |Forbidden | 


ls executable 


-Ownership ————— — ny 


User: bshotts 
Group: bshotts 


图 9-2 KDE 3.5 运行 环境 下 文件 属性 对 话 框 
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可 以 看 到 ， 这 个 对 话 框 中 可 以 设置 文件 所 有 者 、 用 户 组 和 其 他 所 有 用 户 的 
权限 。 在 KDE 运行 环境 下 ， 单 击 该 对 话 框 中 的 “Advanced Permissions (高 级 权 
限 )” 按钮 , 将 弹出 另 一 个 对 话 框 , 在 这 个 对 话 框 中 允许 单独 设置 各 个 模式 属性 。 
另 一 种 易于 理解 的 实现 方式 就 是 使 用 命令 行 ! 


9.2.3 umask 一 一 设置 默认 权限 


umask 命令 控制 着 创建 文件 时 指定 给 文件 的 默认 权限 。 它 使 用 八进制 表示 
法 来 表示 从 文件 模式 属性 中 删除 一 个 位 掩 码 。 


参见 下 面 的 例子 ; 


[meelinuxbox -~]$ rm -f foo.txt 

[me@linuxbox ~]$ umask 

0002 

[meelinuxbox ~]$ > foo.txt 

[me@linuxbox ~]$ 1s -1 foo0.txt 

-rw-rw-r-- 1 me me 0 2012-03-06 14:53 foo.txt 


首先 ， 删 除 foo.txt 文件 存在 的 所 有 副本 ， 以 保证 一 切 都 是 重新 开始 。 下 一 
步 , 运行 不 带 任何 参数 的 umask 命令 , 查看 当前 掩 码 值 , 得 到 的 值 是 0002 (0022 
是 另 一 个 常用 默认 值 )， 它 是 掩 码 的 八进制 表示 形式 。 接 着 创建 文件 foo.txt 的 一 
个 新 实例 ， 查 看 该 文件 的 权限 。 


可 以 发 现 ， 文 件 所 有 者 和 组 都 获得 了 读 写 权 限 ， 而 其 他 所 有 用 户 则 只 获得 
读 权限 。 其 他 所 有 用 户 没有 写 权限 的 原因 在 于 掩 码 值 。 重 复 执行 该 实例 ， 不 过 
这 次 是 自己 设置 掩 码 值 。 
[me@linuxbox ~]$ rm foo.txt 
Ime@linuxbox ~]$ umask 0000 
[me@linuxbox ~]$ > foo.txt 


[me@linuxbox ~]$ 1s -1 foo. txt 
-rw-rw-rw- 1 me me 0 2012-03-06 14:58 foo.txt 


在 设置 掩 码 为 0000《〈 实 际 上 是 关闭 该 功能 ) 时 ， 可 以 看 到 其 他 所 有 用 户 也 
拥有 写 权 限 了 。 为 了 理解 它 是 如 何 实现 的 ， 再 来 看 看 八进制 数 。 如 果 把 该 掩 码 
展开 成 二 进 制 形 式 ， 然 后 再 与 属性 进行 对 比 ， 那 么 就 能 明白 是 怎么 回 事 了 。 


原 给 文件 模式 


结果 


先 忽 略 掉 掩 码 中 前 面 的 0〈 稍 后 再 看 )， 观 察 掩 码 中 出 现 1 的 地 方 ， 将 会 发 
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现 1 的 位 置 对 应 的 属性 被 删除 一 一 在 这 个 例子 中 对 应 的 是 其 他 所 有 用 户 的 写 权 
限 。 这 就 是 掩 码 的 操作 方式 。 掩 码 的 二 进 制 数值 中 每 个 出 现 1 的 位 置 ， 其 对 应 
的 属性 都 被 取消 。 如 果 设 置 掩 码 值 为 0022， 那 么 具体 操作 如 下 。 


原始 文件 模式 


同样 地 ， 二 进 制 数值 中 1 出 现 的 位 置 ， 其 对 应 的 属性 都 被 取消 。 再 试 一 下 
其 他 的 掩 码 值 (尝试 一 些 带 数字 7 的 )， 以 熟悉 掩 码 的 操作 方式 。 记 得 每 次 操作 
完 之 后 清理 文件 ， 并 把 掩 码 值 还 原 到 默认 值 。 


[meelinuxbox ~]$ rm foo.txt; umask 0002 


大 多 数 情 况 下 ， 你 并 不 需要 修改 掩 码 值 ， 系 统 提供 的 默认 掩 码 值 就 很 好 了 。 
然而 ， 在 一 些 高 安全 级 别 的 环境 下 ， 你 则 需要 控制 掩 码 值 。 


一 些 特殊 权限 

虽然 通常 看 到 的 八进制 权限 掩 码 都 是 用 三 位 数字 表示 的 ， 但 是 ， 确 切 地 
说 ， 从 技术 层面 上 来 看 ， 它 是 用 四 位 数字 来 表示 的 。 为 什么 呢 ? 因为 ， 除 了 
读 取 、 写 入 和 执行 权限 之 外 ， 还 有 一 些 其 他 的 较 少 用 到 的 权限 设置 . 

其 中 之 一 是 setuid 位 (八进制 表示 为 4000 )。 当 把 它 应 用 到 一 个 可 执行 文 
件 时 ， 有 效用 户 ID 将 从 实际 用 户 ID (实际 运行 该 程序 的 用 户 ) 设置 成 该 程 
序 所 有 者 的 ID。 大 多 数 情况 下 ， 该 权限 设置 通常 应 用 于 一 些 由 超级 用 户 所 拥 
有 的 程序 。 当 普通 用 户 运 行 一 个 具有 “setuid root”( 已 设置 setuid 位 ， 由 root 
用 户 所 有 ) 属性 的 程序 时 ， 该 程序 将 以 超级 用 户 的 权限 来 执行 。 这 使 得 该 程 
序 可 以 访问 一 些 普通 用 户 通 常 禁止 访问 的 文件 和 目录 。 很 明显 ， 这 会 带 来 
安全 方面 的 问题 ， 因 此 允许 设置 setuid 位 的 程序 个 数 必须 控制 在 绝对 小 的 
范围 内 。 

第 二 个 是 setgid 位 (八进制 表示 为 2000 )。 类 似 于 setuid 位 ， 它 会 把 有 效 
组 ID 从 该 用 户 的 实际 组 ID 更 改 为 该 文件 所 有 者 的 组 ID。 如 果 对 一 个 目录 设 
置 setgid 位 ， 那 么 在 该 目录 下 新 创建 的 文件 将 由 该 目录 所 在 组 所 有 ， 而 不 是 
由 文件 创建 者 所 在 组 所 有 。 当 一 个 公共 组 下 的 成 员 需 要 访问 共享 目录 下 的 所 
有 文件 时 ， 设 置 setgid 位 将 很 有 用 ， 并 不 需要 关注 文件 所 有 者 所 在 的 有 效 组 。 

第 三 个 是 sticky 位 (八进制 表示 为 1000 ). 它 是 从 传统 UNIX 中 继承 下 来 
的 ， 可 以 标记 一 个 可 执行 文件 为 “不 可 交换 的 "。 在 Linux 中 ， 会 忽略 文件 的 
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sticky 位 ， 但 是 如 果 对 一 个 目录 设置 sticky 位 ， 那 么 将 能 阻止 用 户 删 除 或 者 重 
命名 文件 ， 除 非 用 户 是 这 个 目录 的 所 有 者 、 文 件 所 有 者 或 者 是 超级 用 户 。 它 
常用 来 控制 对 共享 目录 (比如 ，/tmp ) 的 访问 . 
这 里 有 一 些 使 用 chmod 命令 和 符号 表示 法 来 设置 这 些 特殊 权限 的 实例 。 
首先 ， 授 予 程序 setuid 权限 : 
chmod uts 程序 名 
下 一 步 ， 授 予 目录 setgid 权限 : 
chmod g+s 目录 
最 后 ， 授 予 目 录 sticky 位 权限 : 
chmod +t 目录 
使 用 ls 命令 可 以 查看 这 些 特殊 权限 的 设置 结果 。 首 先 ， 设 置 了 setuid 位 
的 程序 : 
-rwsr-xr-x 
具有 setgid 属性 的 目录 : 
drwxrwsr-x 
设置 了 sticky 位 的 目录 : 


drwxrwxrwt 


9.3 更改 身 份 


在 很 多 时 候 ， 我 们 会 发 现 可 以 拥有 另 一 个 用 户 的 身份 是 很 有 必要 的 。 我 们 
经 常会 需要 获得 超级 用 户 的 特权 来 执行 一 些 管理 任务 ， 但 是 也 可 以 “ 变 成 另 
一 个 普通 用 户 来 执行 这 些 任务 ， 就 好 像 是 在 测试 一 个 账户 。 有 三 种 方法 用 来 转 
换 身 份 ， 具 体 如 下 。 
。 注销 系统 并 以 其 他 用 户 的 身份 重新 登录 系统 。 
e 使 用 su 命令 。 
e 使 用 sudo 命令 。 

因为 大 家 都 知道 如 何 操作 第 一 种 方法 , 而 且 它 不 如 其 他 两 种 方法 来 得 方便 ， 
所 以 这 里 跳 过 第 一 种 方法 。 在 shell 会 话 状态 下 ， 使 用 su 命令 将 允许 你 假定 为 另 一 
个 用 户 的 身份 ， 既 可 以 以 这 个 用 户 的 ID 来 启动 一 个 新 的 shell 会 话 ， 也 可 以 以 这 个 
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用 户 的 身份 来 发 布 一 个 命令 。 使 用 sudo 命令 将 允许 管理 者 创建 一 个 称 为 
/etc/sudoer 的 配置 文件 ， 并且 定 义 一 些 特定 的 命令 , 这 些 命令 只 有 被 赋予 为 假定 
身份 的 特定 用 户 才 允 许 执行 。 选 择 使 用 哪个 命令 在 很 大 程度 上 取决 于 使 用 的 
Linux 发 行 版 本 。 有 些 发 行 版 本 可 能 对 两 个 命令 都 支持 , 但 是 它 的 系统 配置 可 能 
只 是 偏向 于 其 中 一 个 。 首 先 我 们 来 介绍 su 命令 。 


以 其 他 用 户 和 组 ID 的 身份 来 运行 shell 

su 命令 用 来 以 另 一 个 用 户 的 身份 来 启动 shell。 该 命令 的 一 般 形式 如 下 。 
su [-{1]}] [vser] 

如 果 包 含 “-1” 选 项 ， 那 么 得 到 的 shell 会 话 界面 将 是 用 于 指定 用 户 的 登录 
shell (login shell) 界面。 这 就 意味 着 ， 该 指定 用 户 的 运行 环境 将 被 加 载 ， 而 且 
其 工作 目录 也 将 更 改 为 该 指定 用 户 的 主 目录 。 这 也 常常 我 们 是 想 要 得 到 的 结 
果 。 如 果 没 有 指定 用 户 ， 那 么 默认 假定 为 超级 用 户 。 需 要 注意 的 是 ，-1 可 以 缩 
写 为 -， 而 且 这 一 形式 经 常 被 使 用 。 我 们 可 以 通过 以 下 的 操作 来 以 超级 用 户 的 
身份 启动 shell。 

[meelinuxbox ~]$ su - 


Password : 
[root@linuxbox ~]# 


在 输入 su 命令 后 ， 系 统 会 提示 输入 该 超级 用 户 的 密码 。 如 果 密 码 输 入 正确 ， 
那么 将 会 出 现 新 的 shell 提示 符 , 该 提示 符 表 示 该 shell 将 拥有 超级 用 户 的 特权 
(提示 符 的 末尾 字符 是 #， 而 不 是 $)， 而 且 当 前 的 工作 目录 现在 也 是 用 于 超级 用 
户 的 主 目录 “通常 情况 下 为 hoot)。 一 旦 进入 了 这 个 新 的 ghell 环境 ， 我 们 就 可 
以 以 超级 用 户 的 身份 执行 命令 了 。 在 使 用 结束 时 ， 输 入 exit， 将 返回 到 之 前 的 
shell 环境 。 


9.3.1 su 


[rootelinuxbox ~]# exit 
[meelinuxbox ~]$ 


我 们 也 可 以 使 用 su 命令 执行 单个 命令 ， 而 不 需要 开启 一 个 新 的 交互 式 命令 
界面 ， 操 作 方 式 如 下 。 
Su -ce 'commandg' . 

使 用 这 种 格式 ， 单 个 命令 行将 被 传递 到 一 个 新 的 shell 环境 下 进行 执行 。 这 
里 需要 用 单 引 号 把 命令 行 引 起 来 ， 这 一 点 很 重要 。 因 为 该 命令 扩展 并 不 希望 在 
当前 shell 环境 下 执行 ， 而 是 希望 在 新 的 shell 环境 下 执行 。 
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[meelinuxbox ~]$ su -C '1s -1 /root/ 
Password: 
-FW---- 1 root root 754 2011-08-11 03:19 /root/anaconda-ks.cfg 


/root /Mail: 
total 0 
[me@linuxbox ~]$ 


9.3.2 sudo 一 一 以 另 一 个 用 户 的 身份 执行 命令 


sudo 命令 在 很 多 方面 都 类 似 于 su 命令 ， 但 是 它 另 外 还 有 一 些 重要 的 功能 。 
管理 者 可 以 通过 配置 sudo 命令 ， 使 系统 以 一 种 可 控 的 方式 ， 允 许 一 个 普通 用 户 
以 一 个 不 同 的 用 户 身 份 〈 通 常 是 超级 用 户 ) 执行 命令 。 在 特定 情况 下 ， 用 户 可 
能 被 限制 为 只 能 执行 一 条 或 者 几 条 特定 的 命令 ， 而 对 其 他 命令 没有 执行 权限 。 
另 一 个 重要 的 区 别 在 于 ， 使 用 sudo 命令 并 不 需要 输入 超级 用 户 的 密码 。 使 用 
sudo 命令 时 ， 用户 只 需要 输入 自己 的 密码 来 进行 认证 。 比 如 说 ， 配置 sudo 命令 
来 允许 普通 用 户 运行 一 个 虚构 的 备份 程序 〈 称 为 backup_script)， 这 个 程序 需要 
超级 用 户 的 权限 。 


通过 sudo 命令 ， 该 程序 将 会 以 如 下 的 方式 运行 。 


[meelinuxbox ~]$ sudo backup_script 
Password: 
System Backup Starting... 


在 输入 sudo 命令 后 ， 系 统 将 提示 输入 用 户 自己 的 密码 而 不 是 超级 用 户 
的 密码 )， 而 且 一 旦 认证 通过 ， 指 定 的 命令 就 将 被 执行 。su 命令 和 sudo 命令 之 
间 的 一 个 重要 区 别 在 于 sudo 命令 并 不 需要 启动 一 个 新 的 shell 环境 , 而且 也 不 需 
要 加 载 另 一 个 用 户 的 运行 环境 。 这 意味 着 ， 使 用 sudo 命令 的 时 候 并 不 需要 用 单 
引号 把 命令 行 引起 来 。 需 要 注意 的 是 ， 我 们 可 以 通过 指定 不 同 的 选项 来 改变 命 
令 执行 的 效果 。 查 看 sudo 命令 的 帮助 页 面 可 以 获得 更 多 的 细节 内 容 。 


要 想 知 道 sudo 命令 可 以 授予 哪些 权限 , 可 以 使 用 -1 选项 来 查看 , 具体 如 下 。 


[me@linuxbox ~]$ sudo -1 
User me may run the following commands on this host: 
(ALL) ALL 


Ubuntu 与 sudo 
普通 用 户 经 常会 遇 到 这 样 的 一 个 问题 ， 即 如 何 完 成 某 些 特定 的 、 需 要 超 
级 用 户 权限 才能 完成 的 任务 。 这 些 任 务 包括 安装 和 更 新 软件 、 编 辑 系统 配置 
文件 和 访问 设备 等 。 在 Windows 世界 中 ， 这 些 任 务 通常 是 通过 授予 用 户 管 理 
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员 权 限 来 完成 的 。 然 而 ， 这 也 会 使 得 用 户 执行 的 程序 具有 相同 的 功能 。 大 多 
数 情况 下 ， 这 正 是 用 户 所 期 望 的 结果 ， 但 是 这 样 也 会 使 得 类 似 病毒 这 样 的 恶 
意 软 件 (malware ) 可 以 随意 地 操作 计算 机 。 

在 UNIX 世界 中 ， 由 于 UNIX 多 用 户 的 传统 特性 ， 普 通用 户 和 管理 者 之 
间 一 直 都 存在 着 更 大 的 差别 。UNIX 采用 的 方法 是 只 有 在 需要 的 时 候 才 允许 授 
予 超级 用 户 的 特权 ， 通 常 使 用 su 命令 和 sudo 命令 来 实现 这 一 操作 。 

几 年 前 ， 大 多 数 的 Linux 发 布 版 本 都 依靠 su 命令 来 达成 这 一 目的 。su 命 
令 并 不 需要 sudo 命令 所 要 求 的 配置 环境 ， 而 且 按 照 UNIX 的 传统 ，su 命令 会 
拥有 一 个 root 账户 。 但 是 ， 这 将 会 产生 一 个 问题 ， 即 用 户 在 不 是 很 必要 的 情 
况 下 也 会 试图 以 root 用 户 的 身份 来 进行 操作 。 事 实 上 ， 一 些 用 尸 专门 以 root 
用 户 的 身份 来 操作 系统 ， 从 而 摆脱 那些 烦人 的 “permission denied ( 权限 被 拒 
绝 > 信息， 这 就 使 得 Linux 系统 的 安全 级 别 降 低 到 和 Windows 系统 的 安全 级 
别 一 样 。 因 此 ， 使 用 su 命令 并 不 是 一 个 好 主意 . 

在 推出 Ubuntu 的 时 候 ，Ubuntu 的 创造 者 采取 了 一 个 不 同 的 策略 。 默认 情 
况 下 ，Ubuntu 不 允许 用 户 以 root 账户 的 身份 登录 ( 因为 不 能 成 功 为 root 账户 
设置 密码 )， 取而代之 的 是 使 用 sudo 命令 来 授予 超级 用 户 的 特权 。 最初 的 用 
户 账户 可 以 通过 sudo 命令 来 获得 超级 用 户 的 全 部 权限 ， 后 面 的 用 户 账户 也 可 
以 被 授予 相似 的 权限 。 


9.3.3 ”chown 一 更 改 文件 所 有 者 和 所 属 群 组 


chown 命令 用 来 更 改 文件 或 者 目录 的 所 有 者 和 所 属 群 组 。 使 用 这 个 命令 需 
要 超级 用 户 的 权限 。chown 命令 的 语法 格式 如 下 。 


chown [ower][:igroup]] file .… 


chown 命令 更 改 的 是 文件 所 有 者 还 是 文件 所 属 群 组 ， 或 者 对 两 者 都 更 改 ， 
取决 于 该 命令 的 第 一 个 参数 。 表 9-7 列 出 了 一 些 实例 。 


表 9-7 chown 命令 参数 实例 


少数 ”结果 

bob 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob 

bob:users 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob， 并 把 文件 所 属 群 组 更 改 为 users 组 
:admins 把 文件 所 属 群 组 更 改 为 admins 组 ， 文 件 所 有 者 不 变 

bob: 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob, 并 把 文件 所 属 群 组 更 改 为 用 户 


bob 登录 系统 时 所 属 的 组 
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假设 有 两 个 用 户 一 一 拥有 超级 用 户 权限 的 janet 和 没有 该 权限 的 tony。 用 户 
janet 想 要 从 她 的 主 目录 复制 一 个 文件 到 用 户 tony 的 主 目录 中 。 因 为 用 户 janet 
希望 tony 能 够 编辑 该 文件 ， 所 以 janet 把 该 文件 的 所 有 者 从 janet 更 改 为 tony， 
具体 操作 如 下 。 

[janet@linuxbox ~]$ sudo cp myfile.txt -tony 

0 nuxbox ~]$ sudo 1s -1 -tony/myfile.txt 

-rw-r--r-- 1 root root 8031 2012-03-20 14:30 /home/tony/myfile,.txt 
[janet@linuxbox ~]$ sudo chown tony: ~tony/myfile.txt 


[janet@linuxbox ~]$ sudo 1s -1 ~tony/nmyfile.txt 
-rw-r--r-- 1 tony tony 8031 2012-03-20 14:30 /home/tony/myfile.txt 


这 里 我 们 可 以 看 到 , 用 户 janet 首先 把 文件 从 她 的 目录 复制 到 用 户 tony 的 主 
目录 中 。 接 下 来 ，janet 把 该 文件 的 所 有 者 从 root 〈 使 用 sudo 命令 的 结果 ) 更改 为 
tony。 通 过 在 第 一 个 参数 末尾 加 上 冒号 ，janet 也 把 文件 的 所 属 群 组 更 改 成 了 tony 
登录 系统 时 所 属 的 组 ， 该 组 名 碰巧 也 HH tony。 


值得 注意 的 是 ， 在 janet 第 一 次 使 用 了 sudo 命令 之 后 ， 系 统 为 什么 没有 提 
示 她 输入 她 的 密码 昵 ? 这 是 因为 ， 在 大 多 数 的 配置 环境 下 ，sudo 命令 会 “信任 ” 
用 户 几 分 钟 〈 直 到 计时 结束 )。 


9.3.4 ”chgrp 一 一 更 改 文件 所 性 群 组 


在 更 早 的 UNIX 版 本 中 ，chown 命令 只 能 更 改 文件 的 所 有 者 ， 而 不 能 改变 
文件 所 属 群 组 。 为 了 达到 这 个 目的 ， 我 们 可 以 使 用 一 个 独立 的 命令 chgrp 来 实 
现 。 该 命令 除了 限制 多 一 点 之 外 ， 和 chown 命令 的 使 用 方式 几乎 相同 。 


9.4 权限 的 使 用 


既然 我 们 已 经 学 习 了 权限 是 如 何 工作 的 ， 那 么 现在 是 时 候 学 以 致 用 了 。 接 
下 来 让 我 们 看 一 个 常见 问题 的 解决 方案 一 一 创建 一 个 共享 目录 。 假 设 有 两 个 用 
户 ， 分 别 命名 为 bill 和 karen。 他 们 都 有 音乐 CD 集 ， 并 想 要 创建 一 个 共享 目录 ， 
在 该 目录 下 他 们 各 自 以 Ogg Vorbis 格式 或 者 MP3 格式 来 存储 音乐 文件 。 用 户 
bill 通过 sudo 命令 获得 了 超级 用 户 的 访问 权限 。 

第 一 件 需 要 做 的 事情 ， 就 是 创建 一 个 以 bill 和 karen 为 成 员 的 组 。 通 过 使 用 
GNOME 的 图 形 化 用 户 管理 工具 ，bill 创建 了 一 个 组 ， 命 名 为 music， 并 且 把 用 
户 bill 和 karen 添加 到 该 组 中 ， 如 图 9-3 所 示 。 
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员 权 限 来 完成 的 。 然而， 这 也 会 使 得 用 户 执行 的 程序 具有 相同 的 功能 。 大 多 
数 情况 下 ， 这 正 是 用 户 所 期 望 的 结果 ， 但 是 这 样 也 会 使 得 类 似 病 毒 这 样 的 恶 
意 软件 (malware ) 可 以 随意 地 操作 计算 机 。 

在 UNIX 世界 中 ， 由 于 UNIX 多 用 户 的 传统 特性 ， 普 通用 户 和 管理 者 之 
间 一 直 都 存在 着 更 大 的 差别 。UNIX 采用 的 方法 是 只 有 在 需要 的 时 候 才 允许 授 
予 超级 用 户 的 特权 ， 通 常 使 用 su 命令 和 sudo 命令 来 实现 这 一 操作 。 

几 年 前 ， 大 多 数 的 Linux 发 布 版 本 都 依靠 su 命令 来 达成 这 一 目的 。su 命 

令 并 不 需要 sudo 命令 所 要 求 的 配置 环境 ， 而 且 按 照 UNIX 的 传统 ，su 命令 会 
拥有 一 个 root 账户 。 但 是 ， 这 将 会 产生 一 个 问题 ， 即 用 户 在 不 是 很 必要 的 情 
况 下 也 会 试图 以 root 用 户 的 身份 来 进行 操作 。 事 实 上 ， 一 些 用 户 专门 以 root 
用 户 的 身份 来 操作 系统 ， 从 而 摆脱 那些 烦人 的 “permission denied ( 权限 被 拒 
绝 ) 信息, 这 就 使 得 Linux 系统 的 安全 级 别 降低 到 和 Windows 系统 的 安全 级 
别 一 样 。 因 此 ， 使 用 su 命令 并 不 是 一 个 好 主意 。 

在 推出 Ubuntu 的 时 候 ，Ubuntu 的 创造 者 采取 了 一 个 不 同 的 策略 .。 默认 情 
况 下 ，Ubuntu 不 允许 用 户 以 root 账户 的 身份 登录 (因为 不 能 成 功 为 root 账户 
设置 密码 )， 取 而 代 之 的 是 使 用 sudo 命令 来 授予 超级 用 户 的 特权 。 最 初 的 用 
户 账户 可 以 通过 sudo 命令 来 获得 超级 用 户 的 全 部 权限 ， 后 面 的 用 户 账户 也 可 
以 被 授予 相似 的 权限 。 


9.3.3 chown- 一 一 更 改 文件 所 有 者 和 所 属 群 组 
chown 命令 用 来 更 改 文件 或 者 目录 的 所 有 者 和 所 属 群 组 。 使 用 这 个 命令 需 
要 超级 用 户 的 权限 。chown 命令 的 语法 格式 如 下 。 
chown [ower][:{group]] file ... 
chown 命令 更 改 的 是 文件 所 有 者 还 是 文件 所 属 群 组 ， 或 者 对 两 者 都 更 改 ， 
取决 于 该 命令 的 第 一 个 参数 。 表 9-7 列 出 了 一 些 实例 。 
表 9-7 chown 命令 参数 实例 


bob 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob 


bob:users 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob， 并 把 文件 所 属 群 组 更 改 为 users 组 
:admins 把 文件 所 属 群 组 更 改 为 admins 组 ， 文 件 所 有 者 不 变 
bob: 把 文件 所 有 者 从 当前 所 有 者 更 改 为 用 户 bob, 并 把 文件 所 属 群 组 更 改 为 用 户 


bob 登录 系统 时 所 属 的 组 
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[billelinuxbox ~]$ > /usr/local/share/Music/test file 
[biLlelinuxbox ~]$ ls -1 /usr/local/share/Music 
-rw-r--r-- 1 bill bill 0 2012-03-24 20:03 test file 


实际 上 ， 这 会 产生 两 个 问题 。 第 一 个 问题 是 ， 系 统 中 的 默认 掩 码 是 0022， 
这 将 不 会 允许 组 成 员 对 属于 组 内 其 他 成 员 的 文件 执行 号 入 操作 。 如 果 共 享 目录 
中 只 包含 文件 ， 那 么 这 倒 不 是 问题 ， 但 是 因为 该 目录 下 将 存放 音乐 文件 ， 而 音 
乐 文件 一 般 都 是 按照 艺术 家 和 唱片 集 的 层次 结构 来 组 织 分 类 的 ， 所 以 组 成 员 需 
要 拥有 能 在 同 组 其 他 成 员 创 建 的 目录 下 创建 文件 和 目录 的 权限 。 需 要 把 bill 和 
karen 使 用 的 掩 码 值 更 改 成 0002。 


第 二 个 问题 是 ， 由 成 员 创 建 的 每 一 个 文件 和 目录 都 将 被 设置 为 归属 于 该 用 
户 的 有 效 组 ， 而 不 是 归属 于 music 组 。 可 以 通过 对 该 目录 设置 setgid 位 来 修复 这 
个 问题 。 
[bill@linuxbox ~]$ sudo chmod g+s /usr/local/share/Music 


[billelinuxbox ~]$ ls -1d /usr/local/share/Music 
drwxrwsr-x 2 root music 4096 2012-03-24 20:03 /usr/local/share/Music 


现在 来 测试 一 下 ,看 看 是 否 新 的 权限 修复 了 这 个 问题 。bill 把 他 的 掩 码 值 设 
置 为 0002， 删 除了 之 前 的 测试 文件 ， 又 创建 了 一 个 新 的 测试 文件 和 目录 。 


[billelinuxbox ~]$ umask 0002 

[bill@linuxbox -]$ rm /usr/local/share/Music/test file 
[bill@linuxbox ~]$ > /usr/local/share/Music/test file 
[bill@linuxbox ~]$ mkdir /usr/local/share/Music/test_dir 
[bill@linuxbox ~]$ 1s -1 /usr/local/share/Music 
drwxrwsr-x 2 bill music 4096 2012-03-24 20:24 test dir 
-rw-rw-r-- 1 bill music 0 2012-03-24 20:22 test file 
[bill@linuxbox ~]$ 


当前 创建 的 文件 和 目录 都 具有 正确 的 权限 ， 人 允许 music 组 内 的 所 有 成 员 在 
Mousic 目录 下 创建 文件 和 目录 。 

最 后 剩 下 的 一 个 问题 是 关于 umask 命令 的 。umask 命令 设置 的 掩 码 值 只 能 
在 当前 shell 会 话 中 生效 ， 在 当前 shell 会 话 结束 后 ， 则 必须 重新 设置 。 在 第 11 
章 中 ， 我 们 将 介绍 如 何 使 得 对 umask 命令 掩 码 值 的 更 改 永久 生效 。 


9.5 “更改 用 户 密码 


本 章 的 最 后 一 个 主题 就 是 用 户 如 何 为 自己 设置 密码 〈 如 果 拥 有 超级 用 户 权 
限 ， 那 么 也 可 以 为 其 他 的 用 户 设置 密码 )。 使 用 passwd 命令 ， 可 以 设置 或 者 更 
改 密码 。 该 命令 的 语法 格式 如 下 。 
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Basic Settings 


Group Name: :music 
Group ID: 2001 二 | 


Group Members 
[Wiliam ere pig 0 
口 Guest Account 
h ] root 


Dg ee 
| 国 Karen sphets 四 
4 于 PER 


图 9-3 使 用 GNOME 创建 一 个 新 组 
接 下 来 ，bill 创建 了 存储 音乐 文件 的 目录 。 


[billelinuxbox ~]$ sudo mkdir /usr/local/share/Music 
Password: 


因为 bill 正在 操作 的 对 象 是 他 的 主 目录 之 外 的 文件 ， 所 以 他 需要 拥有 超级 
用 户 的 权限 。 新 创建 的 目录 具有 以 下 的 所 有 权 和 权限 。 


[bill@linuxbox ~]$ ls -1d /usr/local/share/Music 
drwxr-xr-x 2 root root 4096 2012-03-21 18:05 /usr/local/share/Music 


可 以 看 到 ， 这 个 目录 由 root 用 户 所 有 ， 而 且 权 限 值 为 755。 要 使 得 该 目录 
可 共享 ，bill 需要 更 改 该 目录 的 所 属 群 组 ， 而 且 该 组 需要 具有 写 入 权限 。 


[billelinuxbox ~]$ sudo chown :music /usr/local/share/Music 
[bill@linuxbox ~]$ sudo chmod 775 /usr/local/share/Music 
{bille@linuxbox ~]$ ls -1d /usr/local/share/Music 

drwxrwxr-x 2 root music 4096 2012-03-21 18:05 jusr/local/share/Music 


做 所 有 的 这 些 事情 有 什么 意义 呢 ? 它 意 味 着 当前 我 们 已 经 有 了 Hasrlocal/ 
share/Music 目录 ， 该 目录 由 root 用 户 所 有 ， 而 且 music 组 拥有 该 目录 的 读 写 权 
限 。music 组 的 成 员 为 bill 和 karen， 因 此 bil 和 karen 都 可 以 在 目录 /usr/local/ 
share/Music 下 创建 文件 。 其 他 用 户 可 以 列 出 该 目录 下 的 内 容 ， 但 是 不 能 在 该 目 
录 下 创建 文件 。 


但 是 我 们 仍然 有 一 个 问题 。 在 当前 的 权限 下 ， 在 Music 目录 下 创建 的 文件 
和 目录 拥有 用 户 bill 和 karen 的 常规 权限 。 


*10s 


进 程 


现代 操作 系统 通常 都 支持 多 重任 务 处 理 (multitasking)。 多 重任 务 处 理 是 指 
系统 通过 快速 切换 运行 中 的 程序 来 实现 多 任务 的 同时 执行 。Linux 内 核 通过 使 
用 进程 来 管理 多 重任 务 。 进 程 是 Linux 用 来 安排 不 同 程序 等 待 CPU 调度 的 一 
种 组 织 方式 。 


有 时 候 计算 机 运行 速度 会 变 得 很 慢 ， 或 者 应 用 程序 会 停止 响应 。 本 章 将 
介绍 命令 行 中 可 用 来 查看 程序 当前 运行 情况 以 及 终止 运行 异常 的 进程 的 一 些 
工具 。 


本 章 将 介绍 以 下 命令 。 
。 ps: 显示 当前 所 有 进程 的 运行 情况 。 
。 top: 实时 显示 当前 所 有 任务 的 资源 占用 情况 。 
。 jobs: 列 出 所 有 活动 作业 的 状态 信息 。 
。 bg: 设置 在 后 台中 运行 作业 。 
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Passwd {user] 

如 果 要 更 改 的 是 用 户 自己 的 密码 ， 那 么 只 需要 输入 passwd 命令 。 接 下 来 shell 
将 会 提示 用 户 输入 旧 密 码 和 新 密码 。 
[me@linuxbox ~]$ passwd 


(current) UNIX password: 
New UNIX password: 


passwd 命令 会 试 着 强迫 用 户 使 用 “ 强 ” 密 码 。 也 就 是 说 ， 它 会 拒绝 接受 太 
短 的 密码 、 与 之 前 的 密码 相似 的 密码 、 字 上 典 中 的 单词 作为 密码 或 者 是 太 容易 猜 
到 的 密码 。 

[meelinuxbox ~]$ passwd 

(current) UNIX password: 

New UNIX password: 

BAD PASSWORD: is too similar to the old one 
New UNIX password: 

BAD PASSWORD: it is WAY too Short 


New UNIX password : 
BAD PASSWORD: it is based on a dictionary word 


如 果 你 具有 超级 用 户 的 权限 ， 那 么 可 以 通过 指定 一 个 用 户 名 作为 passwd 命 
令 的 参数 来 为 另 一 个 用 户 设置 密码 。 对 于 超级 用 户 ， 还 可 以 使 用 该 命令 的 其 他 
选项 来 设置 账户 锁定 、 密 码 失效 等 功能 。 你 可 以 查看 passwd 命令 的 帮助 页 面 获 
取 更 多 的 细节 内 容 。 
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他 字段 信息 。TTY 是 teleppe《〈 电 传 打字 机 ) 的 缩写 ， 代 表 了 进程 的 控制 终端 
(controlling terminal)。UNIX 在 这 里 也 显示 了 进程 的 运行 时 间 ，TIME 字段 表示 
了 进程 消耗 的 CPU 时 间 总 和 。 可 以 看 出 ， 这 两 个 进程 都 没有 使 计算 机 变 得 忙碌 。 

如 果 在 ps 命令 后 添加 一 个 选项 ， 那 么 我 们 将 得 到 反映 系统 运行 情况 的 更 大 
视图 界面 ， 如 下 所 示 。 


[me@linuxbox ~]$ ps x 


PID TTY STAT TIME COMMAND 

2799 ? Ssl 0:00 /usr/libexec/bonobo-activation-server -ac 
2820 ? sl 0:01 /usr/libexec/evolution-data-server-1.10 -- 
15647 ? Ss 0:00 /bin/sh /usr/bin/startkde 
15751 ? Ss 0:00 /usr/bin/ssh-agent /usr/bin/dbus-launch -- 
15754 ? S 0:00 /usr/bin/dbus-launch --exit-with-session 
15755 ? Ss 0:01 /bin/dbus-daemon --fork --print-pid 4 -pr 
15774 ? ss 0:02 /usr/bin/gpg-agent -s ~daemon 
15793 ? S 0:00 start kdeinit --new-startup +kcminit start 
15794 ? ss 0:00 kdeinit Running... 
15797 ? S 0:00 dcopserver -nosid 


and many more... 


添加 x 选项 (注意 这 里 没有 前 置 的 连 字 符 ) 将 告知 ps 命令 显示 所 有 的 进程 ， 
而 不 需要 关注 它们 是 由 哪个 终端 (如果 有 其 他 的 情况 ) 所 控制 的 。TTY 列 中 出 
现 的 “? ”表示 没有 控制 终端 ， 使 用 这 个 选项 可 以 查看 所 有 进程 的 列表 信息 。 


由 于 系统 中 运行 着 大 量 的 进程 ， 所 以 ps 命令 将 会 输出 一 个 长 列表 。 把 ps 命令 
的 输出 作为 less 命令 输入 的 方法 通常 很 管用 ， 它 可 以 更 方便 地 查看 显示 结果 。 有 些 
选项 组 合 也 会 产生 很 长 的 输出 行 ， 因 此 最 大 化 终端 仿真 窗口 也 是 一 个 好 主意 。 
输出 结果 中 添加 了 一 个 命名 为 STAT 的 新 列 。STAT 是 state 的 缩写 ， 显 示 的 
是 进程 的 当前 状态 ， 如 表 10-1 所 示 。 
表 10-1 进程 状态 


状态 含义 

R 运行 状态 。 进 程 正在 运行 或 者 准备 运行 

S I 进程 不 在 运行 ， 而 是 在 等 待 菜 事件 发 生 ， 如 键盘 输入 或 者 收 到 网 
D 不 可 中 断 的 睡眠 状态 。 进 程 在 等 待 VO 操作 ， 如 硬盘 驱动 

T 暂停 状态 。 进 程 被 指示 暂停 〈 后 续 还 可 继续 运行 ) 

艺 无 效 或 者 “僵尸 ”进程 。 子 进程 被 终止 ， 但 是 还 没有 被 其 父 进程 彻底 释放 掉 


高 优先 级 进程 。 进 程 可 以 被 赋予 更 多 的 重要 性 ， 分 配 更 多 的 CPU 时 间 。 进 程 


< 的 这 一 特性 称 为 优先 级 〈niceness)。 高 优先 级 的 进程 被 说 成 较 不 友好 ， 是 因 
为 它 将 消耗 更 多 的 CPU 时 间 ， 这 样 留 给 其 他 进程 的 CPU 时 间 就 会 变 少 
| 低 优先 级 进程 。 低 优先 级 进程 (友好 进程 ，a nice process) 只 有 在 其 他 更 高 


优先 级 的 进程 使 用 完 处 理 器 后 才能 够 获得 使 用 处 理 器 的 时 间 
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。 名: 设置 在 前 台中 运行 作业 。 
。 kill， 发 送信 号 给 某 个 进程 。 

。 killall: 杀 死 指定 名 字 的 进程 。 
。 shutdown: 关机 或 者 重启 系统 。 


10.1 进程 如 何 工 作 


系统 启动 时 ， 内 核 先 把 它 的 一 些 程序 初始 化 为 进程 ， 然 后 运行 一 个 称 为 init 
的 程序 。 init 程序 将 依次 运行 一 系列 称 为 脚本 初始 化 (init script) 的 shell 脚本 ( 放 
在 /etc 目录 下 )， 这 些 脚本 将 会 启动 所 有 的 系统 服务 。 其 中 的 很 多 服务 都 是 通过 
守护 程序 (daemon program〉 来 实现 的 。 而 后 合 程 序 只 是 呆 在 后 台 做 它们 自己 
的 事情 ， 并 且 没 有 用 户 界面 。 因 此 ， 即 使 没有 用 户 登 录 ， 系 统 也 在 忙于 执行 一 
些 例 行程 序 。 

一 个 程序 的 运行 可 以 触发 其 他 程序 的 运行 ， 在 进程 系统 中 这 种 情况 被 表述 
为 父 进程 创建 子 进程 。 | 

内 核 会 保存 每 个 进程 的 信息 以 便 确保 任务 有 序 进行 。 比 如 ， 每 个 进程 将 被 
分 配 一 个 称 为 进程 ID (PID，process ID) 的 号 码 。 进 程 ID 是 按 递增 的 顺序 来 分 
配 的 ，init 进程 的 PID 始终 为 1。 内 核 也 记录 分 配给 每 个 进程 的 内 存 信息 以 及 用 
来 恢复 运行 的 进程 就 绪 信 息 。 和 文件 系统 类 似 ， 进 程 系统 中 也 存在 所 有 者 、 用 
户 ID、 有 效用 户 ID 等 。 


10.1.1 使 用 ps 命令 查看 进程 信息 


用 来 查看 进程 信息 的 命令 中 (有 多 个 )， 使 用 最 普遍 的 就 是 ps 命令 。ps 命 
令 有 很 多 选项 ， 其 中 最 简单 的 使 用 格式 如 下 所 示 。 
[me@linuxbox ~]$ ps 
PID TTY TIME CMD 


5198 pts/1 00:00:00 bash 
10129 pts/1 00:00:00 ps 


这 个 例子 的 输出 结果 列 出 了 两 个 进程 ， 进程 5198 和 进程 10129， 它 们 分 别 
对 应 bash 命令 和 ps 命令 。 我 们 可 以 发 现 ， 默 认 情 况 下 ，Pps 命令 输出 的 信息 并 
不 是 很 多 ， 只 是 输出 和 当前 终端 会 话 相 关 的 进程 信息 。 为 了 获得 更 多 的 信息 ， 
我 们 需要 添加 一 些 选项 ， 但 是 在 介绍 这 个 之 前 ， 让 我 们 先 看 看 ps 命令 输出 的 其 
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系统 总 体 状 态 信息 ， 下 面 显示 的 是 一 张 按 CPU 活动 时 间 排 序 的 进程 情况 表 。 


top - 14:59:20 up 6:30, 2 users, load average: 0.07, 0.02, 0.00 
Tasks: 109 total, 1 running, 106 sleeping, 0 stopped, 2 zombie 
Cpul(s): 0.7%us, 1.0%sy, 0.0%ni, 98.3%id, 0.0%wa, 0.0%hi, 0.0%si 
Mem: 319496k total, 314860k used, 4636k free, 19392k buff 
Swap: 875500k total, 149128k used, 726372k free, 114676k cach 


PID USER RR NT VIRT RES 号 LEN | COMIAND 
6244 me 39 19 31752 3124 2188 S 6.3 1.0 16:24.42 trackerd 
11071 me 20 0 2304 1092 840R 1.3 0.3 0:00.14 top 
6180 me 20 0 2700 1100 772 S 0.7 0.3 0:03.66 dbus-dae 
6321 me 20 0 20944 7248 6560 S 0.7 2.3 2:51.38 multiloa 
4955 root 20 0 104m 9668 5776 S 0.3 3.0 2:19.39 Xorg 
1root 20 0 2976 528 476S8 0.0 0.2 0:03.14 init 
2 root 15 -5 0 0 0S 0.0 0.0 0:00.00 kthreadd 
3 root RT -5 0 0 0S 0.0 0.0 0:00.00 migratio 
4 root 15 -5 0 0 0s0.0 0.0 0:00.72 ksoftirq 
5 root RT -5 0 0 08 0.0 0.0 0:00.04 watchdog 
6 root 15 -5 0 0 08 0.0 0.0 0:00.42 events/0 
7 root 15 -5 0 0 080.0 0.0 0:00.06 khelper 
41 root 15 -5 0 0 08 0.0 0.0 0:01.08 kblockd/ 
67 root 15 -5 0 0 0S 0.0 0.0 0:00.00 kseriod 
114 root 20 0 0 0 0S8 0.0 0.0 0:01.62 pdflush 
116 root 15 -5 0 0 0S 0.0 0.0 0:02.44 kswapd0 
系统 总 体 状态 信息 包含 很 多 有 用 的 内 容 ， 表 10-3 将 逐条 解释 这 些 字段 ， 具 
体 如 下 。 
表 10-3 顶部 信息 中 的 字段 
行 字段 含义 
1 top 程序 名 
14:59:20 一 天 中 的 当前 时 间 
up 6:30 正常 运行 时 间 (uptime)。 从 机 器 最 后 一 次 启动 开始 计算 的 时 间 总 
数 。 在 这 个 例子 中 ， 系 统 已 经 运行 了 6.5 小 时 。 
2 users 有 两 个 用 户 已 登录 
负载 均值 (load average) 指 的 是 等 待 运行 的 进程 数 ， 即 共享 CPU 资源 
er 的 处 于 可 运行 状态 的 进程 数 。 显 示 的 三 个 值 分 别 对 应 不 同 的 时 间 段 
”第 一 个 对 应 的 是 前 60 秒 的 均值 ,下 一 个 对 应 的 是 前 5 分 钟 的 均值 ， 最 
后 一 个 对 应 的 是 前 15 分 钟 的 均值 。 该 值 小 于 1.0 表示 该 机 器 并 不 忙 
2 tasks: 统计 进程 数 及 各 个 进程 的 状态 信息 
0.7%us 0.7% 的 CPU 时 间 被 用 户 进 程 占用 ， 这 里 指 的 是 处 于 内 核 外 的 进程 
1.0%sy 1.0% 的 CPU 时 间 被 系统 进程 《内核 进 程 ) 占用 
0.0%ni 0.0% 的 CPU 时 间 被 友好 进程 (nice)〔 低 优先 级 进程 占用 
98.3%id 98.3% 的 CPU 时 间 是 空闲 的 
0.0%wa 0.0% 的 CPU 时 间 用 来 等 待 WO 操作 
4 Mem: 显示 物理 RAM 随机 存 取 内 存 〉 的 使 用 情况 


5 Swap: 显示 交换 空间 (虚拟 内 存 》 的 使 用 情况 
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这 些 进 程 状态 的 后 面 可 以 带 其 他 的 字符 来 表示 不 同 的 特殊 进程 特性 。 你 可 
以 查看 ps 命令 的 帮助 页 面 来 获取 更 多 的 详细 信息 。 

另 一 个 常用 的 选项 组 合 是 aax 〈 不 带 前 置 连 字符 )， 它 将 输出 更 多 的 信息 ， 
如 下 所 示 。 


[meelinuxbox -]$ ps aux 
USER PID %CPU %MEM VSzZ RSS TTY STAT START TIME COMMAND 


root 1 0.0 0.0 2136 644 ?  Ss Mar05 0:31 init 
root 2 0.0 0.0 0 0 ?3 S< Mar05 0:00 [kt] 
root 3 0.0 0.0 0 0 ?3 S< Mar05 0:00 [fmil] 
root 4 0.0 0.0 0 0 ?  S< Mar05 0:00 [ks] 
root 5 0.0 0.0 0 0 ? S< Mar05 0:06 [wal 
root 6 0.0 0.0 0 0°? S< Mar05 0:36 [ev] 
root 7 0.0 0.0 0 0? S< Mar05 0:00 [kh] 


and many more... 

该 选项 组 合 将 会 显示 属于 每 个 用 户 的 进程 信息 ， 使 用 这 些 选 项 时 不 带 前 置 
连 字符 将 使 得 命令 以 “BSD 模式 (BSD-style)” 运 行 。ps 命令 的 Linux 版 本 可 
以 模拟 多 种 UNIX 版 本 中 ps 程序 的 运行 方式 ， 使 用 这 些 选项 将 显示 更 多 列 的 
信息 ， 具 体 如 表 10-2 所 示 。 


表 10-2 BSD 模式 下 ps 命令 输出 的 列 标题 


标题 含义 

USER 用 户 ID。 表 示 该 进程 的 所 有 者 

%CPU CPU 使 用 百分比 

%MEM 内 存 使 用 百分比 

VSZ 虚拟 耗 用 内 存 大 小 

RSS 实际 使 用 的 内 存 大 小 。 进 程 使 用 的 物理 内 存 (RAM) 大 小 (以 KB 为 单位 ) 
START 进程 开启 的 时 间 。 如 果 数 值 超过 24 个 小 时 ， 那 么 将 使 用 日 期 来 显示 


10.1.2 ”使 用 top 命令 动态 查看 进程 信息 


虽然 ps 命令 可 以 显示 有 关机 器 运行 情况 的 很 多 信息 , 但 是 它 提供 的 只 是 在 
ps 命令 被 执行 时 刻 机 器 状态 的 一 个 快照 。 要 查看 机 器 运行 情况 的 动态 视图 ， 我 
们 可 以 使 用 top 命令 ， 如 下 所 示 。 
[meelinuxbox ~]$ top 

top 程序 将 按照 进程 活动 的 顺序 ,以 列表 的 形式 持续 更 新 显示 系统 进程 的 当 
前 信息 “默认 每 3 秒 更 新 一 次 )。 它 主要 用 于 查看 系统 “最 高 (top)” 进 程 的 运 
行情 况 ， 其 名 字 也 来 源 于 此 。top 命令 显示 的 内 容 包 含 两 个 部 分 ， 顶 部 显示 的 是 
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在 终端 里 按 下 CtrlLC 键 将 会 中 断 (interrupt) 一 个 程序 ， 它 意味 着 我 们 委婉 
地 请 求 程序 结束 。 按 下 Ctrl-C 键 后 ，xlogo 窗口 将 关闭 ，shell 提示 符 将 返回 。 


许多 (但 不 是 所 有 ) 命令 行程 序 都 可 以 使 用 这 种 方法 来 实现 中 断 。 


10.2.2 ”使 进程 在 后 台 运 行 


假设 我 们 想 要 shell 提示 符 返 回 ， 但 又 不 终止 xlogo 程序 ， 那 么 可 以 通过 让 
该 程序 在 后 台 〈background) 运行 来 实现 。 我 们 可 以 把 终端 想象 为 有 一 个 前 台 
(foreground， 表 面 上 可 见 的 内 容 ， 类 似 shell 提示 符 ) 和 一 个 后 台 ( 隐 藏 在 表层 
下 面 的 内 容 )。 要 想 在 启动 程序 时 让 该 程序 在 后 台 运 行 ， 可 以 在 命令 后 面 加 上 和 
号 字符 (及 ) 来 实现 。 

[me@linuxbox -]$ xlogo & 


[1] 28236 
[meelinuxbox ~]$ 


命令 执行 后 ， 将 出 现 xlogo 窗口 ， 而 且 shell 提示 符 也 将 返回 ， 但 是 同时 也 
会 打印 一 些 有 趣 的 数字 信息 。 这 条 信息 是 shell 的 一 个 称 为 作业 控制 (job control) 
的 特性 表现 。shell 通过 这 条 信息 来 显示 已 经 启动 的 作业 编号 为 1 ([1])， 其 对 应 


的 PID 是 28236。 如 果 执 行 ps 命令 ， 可 以 查看 到 当前 运行 的 进程 。 
[meelinuxbox ~]$ ps 
PID TTY TIME CMD 
10603 pts/1 00:00:00 bash 
28236 pts/1 00:00:00 xlogo 
28239 pts/1 00:00:00 ps 


shell 的 作业 控制 特性 也 提供 了 一 种 方式 来 查看 从 该 终端 启动 的 所 有 作业 。 
使 用 jobs 命令 可 以 得 到 如 下 列表 信息 。 


[me@linuxbox ~]$ jobs 
[1]+ Running X10g0 & 


输出 结果 显示 存在 一 个 编号 为 1 的 作业 在 运行 ， 而 且 对 应 命令 是 xlogo &。 


10.2.3 ”使 进程 回 到 前 台 运 行 
后 台 运 行 的 进程 不 会 受到 任何 键盘 输入 的 影响 ， 包 括 试图 用 来 中 断 它 的 
Ctrl-C 键 。 要 想 使 得 进程 返回 到 前 台 来 运行 ， 可 以 使 用 侈 命令 来 实现 ， 参 见 下 
面 的 例子 。 


[me@linuxbox ~]$ jobs 
[1]+ Running xlogo & 
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top 程序 可 以 接受 许多 键盘 指令 ， 其 中 最 常用 的 有 两 个 : 一 个 是 h， 输 入 后 
将 显示 程序 的 帮助 界面 ， 另 一 个 是 q， 用 来 退出 top 命令 。 


主流 的 桌面 环境 都 提供 了 用 来 显示 类 似 top 命令 的 输出 信息 的 图 形 化 应 用 

程序 (和 Windows 中 任务 管理 器 [Task Manager] 的 运行 方式 类 似 )， 但 是 top 命 

” 令 优 于 图 形 化 版 本 , 这 是 因为 top 命令 运行 得 更 快 , 而 且 消 耗 的 系统 资源 要 少 得 
多 。 毕 竟 ， 系 统 监控 程序 不 应 该 减缓 正在 被 监控 的 系统 的 处 理 速度 。 


10.2 ”控制 进程 


既然 我 们 已 经 知道 了 如 何 查看 和 监控 进程 ， 那 么 接 下 来 让 我 们 看 看 如 何 对 
进程 进行 控制 。 我 们 将 使 用 一 个 称 为 xlogo 的 小 程序 作为 实验 对 象 。xlogo 程序 
是 由 X 窗口 系统 (X Window System， 使 得 显示 器 支持 图 形 化 界面 的 底层 引擎 ) 
提供 的 一 个 示例 程序 ， 它 只 简单 地 显示 一 个 包含 X 标识 的 可 缩放 窗口 。 首 先 ， 
我 们 认识 一 下 实验 对 象 。 


{me@linuxbox ~]$ xlogo 


输入 该 命令 后 ,包含 该 标识 的 一 个 小 窗口 将 在 屏幕 的 某 个 地 方 出 现 。 有些 
系统 中 ，xlogo 可 能 会 输出 一 条 告警 信息 ， 但 是 我 们 可 以 忽略 它 ， 因 为 它 并 不 
会 造成 什么 影响 。 


注意 如 果 系 统 中 不 包含 xlogo 程序 ， 那么 试 着 使 用 gedit 程序 或 者 kwrite 程序 来 
替代 。 


我 们 可 以 通过 改变 窗口 的 大 小 来 验证 xlogo 是 否 处 于 运行 状态 。 如 果 该 标识 
适应 新 的 窗口 大 小 被 重新 绘制 了 ， 则 表明 该 程序 正在 运行 。 


注意 , 为 什么 这 里 shell 提示 符 没有 返回 呢 ? 这 是 因为 shell 正在 等 待 该 xlogo 程 
序 结束 ， 就 像 以 前 使 用 的 其 他 程序 一 样 。 如 果 关 闭 xlogo 窗口 ， 那 么 提示 符 将 返回 。 


10.2.1 中断 进程 


让 我 们 观察 再 次 运行 xlogo 命令 的 时 候 会 发 生 什 么 。 首 先 , 输入 xlogo 命令 ， 
并 确保 程序 在 正常 运行 。 接 下 来 ， 返 回 到 终端 窗口 ， 按 下 Ctrl-C 键 。 


[me@linuxbox ~]$ xlogo 
[me@linuxbox -]$ 
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序 或 者 反 过 来 拒绝 终止 的 程序 。 这 里 有 一 个 例子 ， 如 下 所 示 。 


[me@linuxbox ~]$ xlogo & 

[1] 28401 

[me@linuxbox ~]$ kill 28401 

{1]+ Terminated xlogo 


我 们 首先 在 后 台 启 动 了 xlogo 程序 。shell 将 打印 输出 该 后 台 进 程 的 
jobspec 选项 信息 和 PID 信息 。 接 着 ,我 们 使 用 了 kill 命令 ， 并 且 指 定 想 要 终 
止 进程 的 PID。 我 们 也 可 以 使 用 jobspec 选项 (例如 ，%1) 代替 PID 信息 来 


这 些 看 起 来 都 非常 简单 ,但 是 事实 上 , 它们 包含 着 更 多 的 内 容 。kill 命令 
准确 地 说 并 不 是 “ 杀 死 ”进程 ， 而 是 给 进程 发 送信 号 (signal)。 信 号 是 操作 
系统 和 程序 间 通 信 的 多 种 方式 之 一 ， 在 使 用 Ctrl-C 键 和 Ctrl-Z 键 时 已 经 见识 
过 信号 的 作用 。 当 终端 接收 到 其 中 的 一 个 输入 时 , 它 将 发 送信 号 到 前 台 进 程 。 
在 按 下 Ctrl-C 键 的 情况 下 , 它 将 发 送 一 个 称 为 INT (中 有 断 , Interrupt) 的 信和 号; 
在 按 下 Ctrl-Z 的 情况 下 , 它 将 发 送 一 个 称 为 TSTP (终端 暂停 ，Terminal Stop ) 
的 信号 。 反 过 来 ， 程 序 “ 侦 听 ” 信 和 号， 而 且 在 接收 到 信和 号 的 时 候 按 照 它 们 的 
指示 进行 操作 。 程 序 可 以 侦 听 信号 并 且 可 以 按照 信号 指示 操作 的 这 一 特性 ， 
使 得 程序 在 接收 到 终止 信号 的 时 候 可 以 保存 当前 正在 进行 的 工作 。 


10.3.1 使 用 kill 命令 发 送信 号 到 进程 
kill 命令 最 常用 的 语法 格式 如 下 。 
kill {-signal] PID... 


如 果 命 令 行 中 没有 指定 信和 号， 那么 默认 发 送 TERM (终止 ，Terminate) 信 
号 。kill 命令 最 常用 来 发 送 的 信号 如 表 10-4 所 示 。 
表 10-4 常用 信号 
信号 编号 ”信号 名 含义 


挂 起 信号 。 这 是 美好 的 过 去 留 下 的 痕迹 ， 当 时 通过 电话 线 和 调制 解 调 器 来 
把 终端 和 远 端 计算 机 连接 在 一 起 。 该 信号 用 来 指示 程序 控制 终端 已 被 “ 挂 
起 ”该 信号 的 效果 通过 关闭 终端 会 话 的 方式 来 表现 。 运 行 在 终端 上 的 前 

1 HUP 台 程 序 收 到 该 信和 号 后 将 终止 。 该 信号 也 被 很 多 后 台 程 序 用 来 进行 重新 初始 
化 。 这 就 意味 着 ， 当 一 个 后 台 进 程 接收 到 该 信号 时 ， 它 将 重启 并 且 重 新 读 
取 它 的 配置 文件 。Apache Web 服务 器 就 是 后 台 进程 使 用 HUP 信号 重新 初 
始 化 的 一 个 例子 


中 断 信号 。 执 行 效果 和 在 终端 按 下 Ctrl-C 键 的 效果 一 样 。 通 常用 来 终止 一 
个 程序 
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{me@linuxbox ~]$ fg %1 
xlogo 


我 们 可 以 通过 在 公 命令 后 面 加 上 百分比 符号 和 作业 编号 〈 称 为 jobspec 选 
项 ) 来 实现 这 个 功能 。 如 果 后 台 只 有 一 个 任务 ， 那 么 可 以 不 带 jobspec 选项 。 这 
个 时 候 按 下 Ctrl-C 键 就 可 以 终止 xlogo 命令 。 


10.2.4 停止 ( 暂停 ) 进程 
如 果 我 们 只 是 想 要 暂停 进程 ， 而 不 是 终止 进程 ， 那 么 通常 需要 我 们 将 前 台 
运行 的 进程 移 到 后 台 去 运行 。 我 们 为 了 暂停 前 台 进 程 需要 按 下 Ctrl-Z 键 。 让 我 们 
试 试 如 下 操作 ， 在 命令 提示 符 后 输入 xlogo， 按 下 Enter 键 后 再 按 下 Ctrl-Z 键 。 
[meelinuxbox ~]$ xlogo 


[1]+ Stopped xlogo 
[me@linuxbox ~]$ 


在 暂停 xlogo 命令 后 ， 我 们 可 以 通过 试图 改变 xlogo 窗口 的 大 小 来 确认 该 程 
序 是 否 真正 被 暂停 了 。 可 以 发 现 ， 该 进程 看 起 来 好 像 死 了 。 这 个 时 候 ， 我 们 可 
以 使 用 使 命令 让 进程 在 前 台 恢 复 运 行 ， 也 可 以 使 用 bg 命令 让 进程 移 到 后 台 运 行 : 
[me@linuxbox -]$ bg %1 


[1]+ xlogo & 
[me@linuxbox ~]$ 


在 使 用 代 命令 的 时 候 ， 如 果 只 存在 一 个 作业 ， 那 么 可 以 不 带 jobspec 选项 。 

如 果 用 命令 方式 启动 了 一 个 图 形 化 程序 ， 但 是 忘记 了 在 命令 尾部 加 上 “ 克 ” 
符号 来 让 程序 在 后 台 运 行 ， 那 么 在 这 种 情况 下 ， 把 进程 从 前 台 移 到 后 台 去 运行 
的 方法 将 非常 方便 。 

为 什么 会 想 要 通过 命令 行 的 方式 来 启动 一 个 图 形 化 程序 呢 ? 原因 有 两 个 。 
首先 ， 想 要 运行 的 程序 可 能 并 不 在 窗口 管理 器 的 菜单 中 〈 比 如 xlogo 程序 )。 

其 次 ， 从 命令 行 启动 程序 可 以 看 到 用 图 形 化 方式 启动 程序 所 看 不 到 的 错误 
信息 。 有 时 候 从 图 形 菜单 中 启动 程序 ， 程 序 会 启动 失败 。 但 改 用 命令 行 方式 启 
动 的 话 ， 就 可 以 得 到 错误 提示 信息 ， 找 到 问题 所 在 。 另 外 ， 一 些 图 形 化 程序 也 
包含 很 多 有 意思 的 和 有 用 的 命令 行 选项 。 


10.3 ”信和 号 
kill 命令 通常 用 来 “ 杀 死 ” (终止 ) 进程 ， 它 可 以 用 来 终止 运行 不 正常 的 程 
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表 10-5 其 他 常用 信号 


信号 编号 信号 名 含义 
3 QUIT 退出 信号 
段 错误 信号 。 如 果 程 序 非 法 使 用 了 内 存 空间 ， 即 程序 试 
11 SEGV 图 在 没有 写 权 限 的 空间 执行 写 操作 ， 那 么 系统 将 发 送 该 
信和 号 
终端 暂停 信号 。 在 按 下 Ctrl-Z 键 时 终端 将 发 出 该 信号 。 与 
20 TSTP STOP 信和 号 不 同 的 是 ，TSTP 信和 号 由 程序 接收 ， 但 是 程序 可 
以 选择 忽略 该 信号 
窗口 改变 信号 。 当 窗口 改变 大 小 时 ， 系 统 将 发 送 该 信号。 
28 WINCH 类 似 top 和 less 的 一 些 程序 将 会 对 该 信号 作出 响应 ， 重 新 
绘制 视图 来 适应 新 的 窗口 大 小 


如 果 想 要 查看 更 多 的 信号 ， 使 用 如 下 命令 将 显示 完整 的 信号 列表 。 


[me@linuxbox ~}$ ktlL1 -1 


10.3.2 ”使 用 killall 命令 发 送信 号 给 多 个 进程 


通过 使 用 killall 命令 ， 我 们 可 以 给 指定 程序 或 者 指定 用 户 名 的 多 个 进程 发 
送信 号 。 一 般 语法 格式 如 下 。 
killall [-U User] [-signall] name... 


要 证 明 这 一 点 ， 我 们 可 以 先 启动 两 个 xlogo 程序 实例 ， 然 后 终止 它们 。 


[me@linuxbox ~]$ xlogo & 
{1] 18801 


[me@linuxbox ~]$ xlogo & 
[2] 18802 
[me@linuxbox ~]$ killall xlogo 
[1]- Terminated xlogo 
[2]+ Terminated xlogo 
记 住 ， 和 kill 命令 一 样 ， 你 必须 具有 超级 用 户 权限 ， 才 能 够 使 用 killall 命令 
给 不 属于 自己 的 进程 发 送信 和 号 。 


10.4 更 多 与 进程 相关 的 命令 


由 于 进程 监控 是 一 项 重要 的 系统 管理 任务 ， 所 以 存在 很 多 命令 用 来 为 它 服 
务 。 表 10-6 列 出 了 其 中 一 些 命令 。 
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续 表 


洁 号 编号 。 信号 名 . 含义 
杀 死 信号 。 该 信号 比较 特殊 。 鉴 于 程序 可 以 选择 不 同 的 方式 来 处 理发 送 过 
来 的 信号 ， 包 括 忽 略 所 有 的 这 些 信号 ，KILL 信号 将 不 会 真正 意义 上 地 被 
发 送 到 目标 程序 。 而 是 内 核 宁愿 立即 终止 了 该 进程 。 当 进程 以 这 种 方式 被 


3 SE 终止 时 ， 它 将 没有 机 会 对 它 自 己 进行 “清理 ”或 者 对 当前 工作 进行 保存 。 
考虑 到 这 个 原因 ，KILL 信号 只 能 当 作 其 他 的 终端 信号 都 执行 失败 的 情况 
下 的 最 后 选择 | 

ee 终止 信和 号。 这 是 kill 命令 默认 发 送 的 信号 类 型 。 如 果 程 序 仍然 有 足够 的 “ 活 


力 ”(alive enough) 来 接收 信号 ， 那 么 它 将 被 终止 
18 CONT 继续 运行 信号 。 恢 复 之 前 接受 了 STOP 信号 的 进程 


暂停 信号 。 该 信号 将 使 进程 暂停 ， 而 不 是 终止 。 和 KILL 信和 号 类 似 ， 该 信 


19 SO 号 不 会 被 发 送 给 目标 进程 ， 因 此 它 不 能 被 忽略 


按照 下 面 的 方式 使 用 kill 命令。 


[meelinuxbox -~]$ xlogo & 

[1] 13546 

[me@linuxbox ~]$ kill -1 13546 
[1]+ Hangup xlogo 


在 这 个 例子 中 ， 我 们 首先 在 后 台 启 动 了 xlogo 程序 ， 接 着 使 用 kill 命令 给 
它 发 送 HUP 信号 。xlogo 程序 将 终止 ，shell 的 输出 信息 表明 这 个 后 台 进 程 已 
经 接收 了 一 个 挂 起 信和 号 ,你 也 许 需 要 多 敲 几 次 Enter 键 才能 看 到 这 条 输出 信息 。 
注意 , 你 可 以 通过 信号 编号 或 者 信号 名 来 指定 信号 , 其 中 包含 带 有 SIG 前 缀 的 
信号 名 。 


[me@linuxbox ~]$ xlogo & 
[1] 13601 
{me@linuxbox ~]$ Kkill -INT 13601 
~ [1]+ Interrupt xlogo 
[me@linuxbox ~]$ xlogo & 
[1] 13608 
[me@linuxbox ~]$ kill -SIGINT 13608 


[1]+ Interrupt xlogo 
尝试 使 用 其 他 的 信号 重复 执行 上 面 的 例子 。 记 住 , 你 也 可 以 使 用 jobspec 选 
项 来 代替 PID 信息 。 


和 文件 一 样 ， 进 程 也 有 所 有 者 ， 只 有 进程 的 所 有 者 〈 或 者 超级 用 户 ) 才能 
使 用 kill 命令 来 给 它 发 送信 号 。 


除了 表 10-4 中 列 出 的 通常 用 于 kill 命令 的 信号 之 外 ， 还 存在 其 他 一 些 经 常 
被 系统 使 用 的 信号 。 表 10-5 列 出 的 是 其 他 的 一 些 常用 信号 。 


第 二 部 分 
配置 与 环境 
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表 10-6 其 他 与 进程 相关 的 命令 
命令 描述 


pstree 以 树 状 的 模式 输出 进程 列表 ， 该 模式 显示 了 进程 间 的 父 / 子 关系 


输出 系统 资源 使 用 情况 的 快照 ， 包 括 内 存 ， 交 换 空间 和 磁盘 VO。 如 果 想 要 
持续 查看 输出 ， 可 以 在 命令 后 面 加 上 一 个 间隔 时 间 〔 以 秘 为 单位 )， 命 令 将 


We 按照 间隔 时 间 来 动态 更 新 显示 的 内 容 (比如 ，vmstat 5)。 按 下 Ctrl-C 键 可 以 
终止 输出 
xload 用 来 绘制 显示 系统 时 间 负 载 情 况 图 形 的 一 种 图 形 化 界面 程序 


tload 类 似 于 xload 程序 ， 但 是 图 形 是 在 终端 上 绘制 。 按 下 Ctrl-C 键 终止 输出 
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环 境 


前 面 讲 到 ， 在 shell 会 话 调用 环境 (environment) 期 间 ，shell 会 存储 大 量 的 信 
息 。 程 序 使 用 存储 在 环境 中 的 数据 来 确定 我 们 的 配置 。 尽 管 大 多 数 系统 程序 使 用 配 
置 文件 (configuration file) 来 存储 程序 设置 ， 但 是 也 有 一 些 程序 会 查找 环境 中 存储 
的 变量 来 调整 自己 的 行为 。 知 道 这 一 点 之 后 ， 用 户 就 可 以 使 用 环境 来 自 定义 shell。 


本 章 会 讲解 下 述 命令 。 
。 printenv: 打印 部 分 或 全 部 的 环境 信息 。 
。 set: 设置 shell 选项 。 
。 export: 将 环境 导出 到 随后 要 运行 的 程序 中 。 
。 alias: 为 命令 创建 一 个 别名 。 


11.1 环境 中 存储 的 是 什么 


尽管 shell 在 环境 中 存储 了 两 种 基本 类 型 的 数据 ， 但 是 在 bash 中 ， 这 两 种 类 
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[me@linuxbox ~]$ set | less 


与 printenv 命令 不 同 的 是 ，set 命令 的 输出 结果 是 按照 字母 顺序 排列 的 。 
如 需要 查看 单个 变量 的 值 ， 我 们 也 可 以 使 用 echo 命令 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo $HOME 
/home /me 


set 命令 和 printenv 命令 都 不 能 显示 的 一 个 环境 元 素 是 别名 。 要 查看 别名 ， 
需 使 用 不 带 任何 参数 的 alias 命令 。 


[me@linuxbox ~]$ alias 

alias 1.=']s -d .* --color=tty' 

alias 1l1=']s -1 --color=tty' 

alias ls='ls --color=tty'! 

alias Vi='Vim' 

alias which='alias | /usr/bin/which --tty-only --read-alias --show-dot --showtilde' 


11.1.2 一 些 有 趣 的 变量 


环境 中 包含 了 相当 多 的 变量 ， 尽 管 你 所 使 用 的 环境 与 这 里 的 不 相同 ， 也 会 
在 你 的 环境 中 看 到 表 11-1 中 所 示 的 变量 。 


表 11-1 环境 变量 

变量 说 明 

站 SA 和 通常 为 :O， 表 示 由 X 服务 器 生成 的 第 一 个 

EDITOR 用 于 文本 编辑 的 程序 名 称 

SHELL 本 机 shel 名 称 

HOME , 本 机 主 目录 的 路 径 名 

LANG 定义 了 本 机 语言 的 字符 集 和 排序 规则 

OLD PWD 先前 的 工作 目录 

PAGER 用 于 分 页 输出 的 程序 名 称 。 通 常设 置 为 /usr/bin/less 

以 冒号 分 割 的 一 个 目录 列表 ， 当 用 户 输入 一 个 可 执行 程序 的 名 称 时 ,会 查找 
该 目录 列表 

Psl 提示 符 字 符 串 1。 定 义 了 本 机 shell 系统 提示 符 的 内 容 。 在 后 面 我 们 会 看 到 ， 
可 以 灵活 地 自 定义 该 变量 

PWD 当前 工作 目录 

TERM 终端 类 型 的 名 称 。 类 UNIX 系统 支持 很 多 种 终端 协议 ; 此 变量 设 定 了 本 机 终 
端 模拟 器 使 用 的 协议 


用 于 指定 本 机 所 处 的 时 区 。 大 多 数 类 UNIX 系统 以 协调 世界 时 CUTC) 来 维护 
计算 机 的 内 部 时 钟 , 而 显示 的 本 地 时 间 是 根据 本 变量 确定 的 时 差 计 算出 来 的 


USER 用 户 名 
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如 果 某 些 变量 无 法 在 该 表 中 找到 也 不 要 紧 ， 因 为 这 些 变量 会 因 发 行 版 本 的 
不 同 而 有 差异 。 


11.2 环境 是 如 何 建立 的 


用 户 登录 系统 后 ，bash 程序 就 会 启动 并 读 取 一 系列 称 为 启动 文件 的 配置 脚 
本 ， 这 些 脚 本 定义 了 所 有 用 户 共享 的 默认 环境 。 接 下 来 ，bash 会 读 取 更 多 存储 
在 主 目录 下 的 用 于 定义 个 人 环境 的 启动 文件 。 这 些 步骤 执行 的 确切 顺序 是 由 启 
动 的 shell 会 话 类 型 决定 的 。 


11.2.1 login 和 non-login shell 
shell 会 话 存在 两 种 类 型 ， 分 别 为 login shell 会 话 和 non-login shell 会 话 。 


login shell 会 话 会 提示 用 户 输入 用 户 名 和 密码 ， 如 虚拟 控制 台 会 话 。 而 我 们 
在 GUI 中 启动 的 终端 会 话 就 是 一 个 典型 的 non-login shell 会 话 。 


login shell 会 读 取 一 个 活 多 个 启动 文件 ， 如 表 11-2 所 示 。 


表 11-2 login shell 的 启动 文件 


文件 说 明 

/etc/profile 适用 于 所 有 用 户 的 全 局 配置 脚本 

~/.bash_profile 用 户 的 个 人 启动 文件 。 可 扩展 或 重 写 全 局 配置 脚本 中 的 设置 

~/.bash_login 车 ~/.bash_profile 缺失 ， 则 bash 尝试 读 取 此 脚本 

/profile 车 ~/.bash_profile 与 ~/.bash_login 均 缺 失 ， 则 bash 尝试 读 取 此 文件 。 
在 基于 Debian 的 Linux 版 本 中 比如 Ubuntu)， 这 是 默认 值 


表 11-3 所 示 为 non-login shell 读 取 的 启动 文件 。 


表 11-3 non-login shell 的 启动 文件 


文件 内 容 : 
/etc/bash.bashrc 适用 于 所 有 用 户 的 全 局 配置 脚本 
~/.bashre 用 户 的 个 人 启动 文件 。 可 扩展 或 重 写 全 局 配置 脚本 中 的 设置 


在 读 取 以 上 启动 文件 之 外 ，non-login shell 还 会 继承 父 类 进程 的 环境 ， 父 类 
进程 通常 是 一 个 login shell。 


用 户 可 查看 本 机 系统 有 哪些 启动 文件 ， 需 要 注意 的 是 这 些 文件 大 多 数 以 “.” 
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开头 (意味 着 这 些 文件 是 被 隐藏 的 )， 所 以 用 户 在 使 用 ls 命令 时 ， 需 要 伴随 使 用 
-a 选项 。 

在 普通 用 户 看 来 ，~/.bashrc 可 能 是 最 重要 的 启动 文件 ， 因 为 系统 几乎 总 是 
要 读 取 它 。non-login shell 会 默认 读 取 ~/,bashrc， 而 大 多 数 login shell 的 启动 文件 
也 能 以 读 取 ~/.bashrc 文件 的 方式 来 编写 。 


11.2.2 ”启动 文件 中 有 什么 
一 个 典型 的 .bash_profile 来 自 于 CentOS-4 系统 ) 内 容 如 下 所 示 。 


# .bash profile 
# Get the aliases and functions 
if [ -f -~/.bashrc ]; then 
. ~/.bashrc 
fi 
# User Specific environment and startup programs 


PATH=$PATH: $HOME /bin 
export PATH 


文件 中 以 “#” 开 始 的 行 是 注释 行 ， 而 shell 是 不 会 读 取 注 释 行 的 ， 注 释 是 
为 提高 用 户 可 读 性 而 存在 的 。 一 件 有 趣 的 事 发 生 在 第 4 行 ， 如 下 所 示 。 


if [ -f-/.bashrc ]; then 
. ~/.bashre 
fi 


这 段 代码 被 称 作 计 复合 命令 ， 会 在 本 书 的 第 四 部 分 进行 讲解 ， 现 在 可 以 将 
这 段 代 码 理解 为 如 下 所 示 的 内 容 。 


If the file“"~-/.bashrc" exists, then 
read the “~/ .bashrc" file. 


可 以 看 到 这 一 段 代码 阐述 了 login shell 读 取 .bashrec 文件 的 机 制 。 以 上 启动 
文件 中 另 一 个 很 重要 的 元 素 是 PATH 变量 。 

在 命令 行 输入 一 条 命令 后 ， 你 曾经 疑惑 过 shell 是 怎样 找到 这 些 命令 的 吗 ? 
当 用 户 输 入 命令 1s, shell 不 会 搜索 整个 系统 来 寻找 /birls(ls 命令 的 完整 路 径 名 )， 
而 是 会 搜索 PATH 变量 中 存储 的 目录 列表 。 

PATH 变量 通常 是 由 启动 文件 /etc/profile 中 的 一 段 代码 设 定 ( 并 不 总 是 如 
此 ， 这 取决 于 系统 的 发 行 版 本 )。 


PATH=$PATH: $HOME /bin 


这 段 代 码 将 $SHOME/bin 添加 到 了 PATH 值 的 尾部 。 这 是 一 个 参数 扩展 的 
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实例 ， 本 书 第 7 章 介 绍 过 相关 的 内 容 。 以 下 代码 可 以 帮助 用 户 理解 参数 扩展 
的 机 理 。 

fmeelinuxbox ~]$ foo="This is some" 

{me@linuxbox ~]$ echo $foo 

This is some 

[me@linuxbox ~]$ foo=$f0o0" text." 


[meelinuxbox ~]$ echo $foo 
This is some text. 


使 用 参数 扩展 ， 用 户 可 以 将 更 多 的 内 容 添加 到 变量 值 的 尾部 。 


在 把 字符 串 $HOME/bin 添加 到 PATH 值 的 尾部 之 后 ， 当 系统 需要 检索 用 户 
输入 的 命令 时 ，$HOME/bin 这 个 路 径 就 会 处 于 被 搜索 的 路 径 列表 中 。 这 就 意味 
着 当 我 们 想 在 主 目录 下 创建 名 为 bin 的 目录 ,并 在 此 目录 中 存放 自己 的 私有 程序 
时 ，shell 已 经 为 我 们 准备 好 了 ， 我 们 要 做 的 就 是 将 创建 的 目录 称 之 为 bin。 


注意 很 多 Linux 发 行 版 本 在 默认 情况 下 提供 了 该 PATH 设置 .一 些 基于 Debian 
的 发 行 版 本 ， 如 Ubuntu, 会 在 登录 时 检查 ~/bin 目录 是 否 存在 ， 若 存在 ， 就 会 自 
动 将 其 添加 到 PATH 变量 中 。 


最 后 一 行 是 如 下 代码 : 
export PATH 


该 export 命令 告诉 shell， 将 shell 的 子 进程 使 用 PATH 变量 的 内 容 。 


11.3 ”修改 环境 


现在 用 户 已 经 知道 了 系统 启动 文件 的 位 置 和 内 容 , 就 可 以 修改 启动 文件 ， 
来 自 定义 我 们 的 环境 。 


11.3.1 用 户 应 当 修 改 哪些 文件 


一 般 来 说 ， 在 PATH 中 添加 目录 ， 或 者 定义 额外 的 环境 变量 ， 需 要 将 这 些 
更 改 放 入 到 .bash_profile 文件 中 (或 者 是 其 他 的 等 效 文件 ， 这 取决 于 系统 的 发 行 
版 本 ， 比 如 Ubuntu 系统 使 用 的 是 .profile 文件 )， 其 他 的 改变 则 应 录入 .bashrc 文 
件 中 。 除 非 是 系统 管理 员 需 要 修改 用 户 公 用 的 默认 设置 ， 普 通用 户 只 需 对 主 目录 
下 的 文件 作出 修改 即 可 。 当 然 用 户 也 可 以 修改 其 他 目录 下 的 文件 ， 比 如 /etc 下 的 
profile 文件 ， 而 且 很 多 情况 会 需要 用 户 这 样 做 ， 但 是 现在 我 们 先 保险 一 点 操作 。 
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11.3.2 文本 编辑 器 


为 了 编辑 〈 比 如 修改 ) shell 的 启动 文件 ， 以 及 系统 中 的 其 他 大 多 数 配 置 文 
件 ， 我 们 会 用 到 一 个 称 为 文本 编辑 器 的 程序 。 文 本 编辑 器 类 似 于 字 处 理 器 ， 它 
允许 用 户 通过 移动 移动 光标 的 方式 来 编辑 屏幕 中 的 文字 。 与 字 处 理 器 不 同 的 是 ， 
文本 编辑 器 只 支持 纯 文本 ， 而 且 通 常 包 含 为 编写 程序 而 设计 的 特性 。 文 本 编辑 
器 是 软件 开发 人 员 编写 代码 的 主要 工具 ， 系 统管 理 员 也 可 以 使 用 文本 编辑 器 来 
管理 系统 的 配置 文件 。 


Linux 系统 可 使 用 的 文本 编辑 器 有 很 多 种 , 你 的 系统 中 可 能 装 有 不 止 一 种 的 
文本 编辑 器 。 为 什么 会 有 这 么 多 种 编辑 器 ? 主要 是 因为 程序 员 热 衷 于 编写 文本 
编辑 器 ， 既 然 程 序 员 在 工作 中 会 广泛 地 用 到 编辑 器 ， 他 们 希望 文本 编辑 器 能 符 
合 自己 的 工作 方式 。 


文本 编辑 器 可 大 概 分 为 两 类 : 图 形 界面 的 和 基于 文本 的 。GNOME (GNU 
网 络 对 象 模型 环境 ) 和 KDE (K 桌面 环境 ) 都 配备 有 一 些 流行 的 图 形 界面 编辑 
器 。 GNOME 配备 的 编辑 器 叫做 gedit, 在 GNOME 菜单 中 gedit 通常 被 称 为 Text 
Editor。KDE 则 配备 了 三 种 编辑 器 , 分 别 是 kedit、 kwrite 和 kate (复杂 程度 递增 )。 


有 很 多 种 基于 文本 的 编辑 器 ， 常 见 编辑 器 中 较 受 用 户 欢迎 的 是 nano、vi 和 
emacs。nano 是 一 种 简单 易 用 的 编辑 器 ， 最 初 是 为 了 替代 pico (由 PINE 电子 邮 
件 套 件 提供 ) 而 出 现 的 。vi 是 类 Unix 系统 的 传统 文本 编辑 器 (在 大 多 数 Linux 
系统 中 已 被 Vim 一 一 Vi Improved 的 缩写 一 一 所 取代 )， 本 书 第 12 章 的 讲解 
主题 就 是 vi。 而 emacs 编辑 器 最 初 由 Richard Stallman 编写 ， 这 是 一 个 庞大 
的 、 万 能 的 、 可 做 任何 事情 的 编辑 环境 。 尽 管 emacs 仍然 可 用 ， 但 是 大 多 数 
Linux 系统 很 少 默 认 安 装 emacs。 


11.3.3 ”使 用 文本 编辑 器 


所 有 的 文本 编辑 器 都 可 以 通过 在 命令 行 输入 编辑 器 名 称 和 需 编 辑 的 文件 名 
称 的 方式 启动 。 如 果 输 入 的 文件 不 存在 ， 编 辑 器 会 认为 用 户 想 要 创建 一 个 新 的 
文件 。 下 面 是 一 个 使 用 gedit 的 范例 。 


[meelinuxbox ~]$ gedit some file 
如 果 some_file 文件 存在 ,这 条 命令 将 启动 gedit 编辑 器 ， 并 载 入 some_file。 
因为 所 有 的 图 形 界 面 编辑 器 都 非常 易于 理解 ， 所 以 这 里 就 不 做 歼 述 。 接 下 
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来 ， 我 们 将 通过 .bashrc 文件 的 编辑 过 程 来 讲解 nano，nano 是 第 一 个 基于 文本 的 
文本 编辑 器 。 但 在 此 之 前 ， 需 要 先 采 取 一 些 安全 措施 。 在 修改 一 些 重 要 的 配置 
文件 时 ， 先 对 配置 文件 进行 备份 再 进行 编辑 是 一 个 很 好 的 习惯 。 当 用 户 把 文件 
修改 得 一 团 糟 的 时 候 ， 备 份 就 很 有 用 处 了 。 我 们 可 以 使 用 以 下 代码 备份 .bashrc; 


[meelinuxbox ~]$ cp .bashrc .bashrc.bak 


为 备份 文件 取 什 么 名 字 并 不 重要 ， 只 要 备份 文件 的 名 称 易 于 理解 即 可 。 扩 
展 名 .bak、.sav、.old 和 .orig 是 常用 的 标示 备份 文件 的 方法 。 需 要 说 明 的 是 ，cp 
命令 会 默默 地 覆盖 现 有 的 文件 。 


备份 文件 完成 之 后 ， 就 可 以 启动 文件 编辑 器 了 。 
[me@linuxbox -]$ nano .bashrc 

nano 启动 后 ， 屏 幕 显示 内 容 如 下 所 示 。 

GNU nano 2.0.3 File: .bashrc 
# .bashrc 
# Source global definitions 
if [ -f /etc/bashrc ]; then 
. 。 /etc/bashrc 
fi 
# User specific aliases and functions 
[ Read 8 lines ] 


“G Get Help^0 Write0ut^R Read Fil^Y Prev Pag^K Cut Text^C Cur Pos 
“^X Exit ^J Justify ^W Where Is’V Next Pag^U UnCut Te“T To Spell 


若 系 统 没 有 安装 nano， 也 可 以 使 用 图 形 界 面 编辑 器 来 进行 操作 。 


屏幕 显示 内 容 分 为 三 部 分 ， 顶 端的 标题 (header)、 中 间 的 可 编辑 文本 和 底部 的 
命令 菜单 。 由 于 nano 是 替代 电子 邮件 文本 编辑 器 出 现 的 , 所 以 其 编辑 功能 非常 有 限 。 


对 于 每 一 种 文本 编辑 器 ， 你 都 应 该 首先 学 习 它 的 退出 命令 。 就 nano 来 说 ， 
可 按 Ctrl-X 退出 程序 ,在 页 面 底部 的 命令 菜单 中 有 相关 的 介绍 。^X ”代表 了 Ctrl-X， 
这 是 控制 字符 的 常见 表示 法 ， 很 多 程序 中 都 使 用 它 。 

我 们 需要 了 解 的 第 二 个 命令 就 是 如 何 保存 我 们 的 工作 。 就 nano 来 说 ， 按 Ctl-O 
完成 保存 。 掌 握 这 些 知 识 之 后 ， 我 们 就 可 以 进行 文本 编辑 操作 了 。 请 使 用 向 下 箭头 
键 或 者 向 下 翻 页 键 使 光标 移动 到 文件 的 末尾 ， 然 后 添加 以 下 代码 到 .bashrc 文件 中 。 
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unmask 0002 

export HISTCONTROL=ignoredups 
export HISTSIZE=1000 

alias 1.='ls -d .* --color=auto' 
alias 11='18 -1 --color=auto’ 


注意 用 户 系统 的 .bashrc 文件 可 能 已 经 写 入 了 这 些 代码 的 一 部 分 ， 但 是 不 用 担心 ， 
重复 的 代码 不 会 造成 什么 危害 。 


表 11-4 列 出 了 以 上 代码 的 含义 。 
表 11-4 .bashrc 文件 增加 的 代码 


代码 行 含义 

Umask 0002 设置 umask 值 以 解决 第 9 章 中 讨论 过 的 共享 目录 的 问题 
Export HiSTCONTROL=ignoredups ”使 shell 的 历史 记录 功能 忽略 与 上 一 条 录入 的 命令 重复 的 命令 
Export HISTSIZE=1000 使 命令 历史 记录 规模 从 默认 的 500 行 增加 到 1000 行 

alias 1.="ls -d .* --color=auto’ 创建 新 的 命令 ,1.， 功 能 是 显示 所 有 以 . 开头 的 目录 条 目 
alias ll=’ls -| -color=auto’ 创建 新 的 命令 : 1， 功 能 是 以 长 格式 来 展示 目录 列表 


可 以 看 到 ， 很 多 新 增加 的 代码 并 不 易于 理解 ， 所 以 就 需要 在 .bashrc 文件 中 
添加 一 些 注释 来 帮助 用 户 理解 代码 的 含义 。 添 加 注释 后 的 代码 如 下 所 示 。 


# Change umask to Wake directory Sharing easier 
umask 0002 


# Ignore duplicates in command history and increase 
# history size to 1000 lines 

export HISTCONTROL=ignoredups 

export HISTSIZE=1000 


# Add some helpful aliases 


alias 1.='1S -d .* --color=auto' 
alias ll='ls -1 --color=auto' 


这 样 一 来 就 易 懂 多 了 。 最 后 我 们 按 Ctrl-O 保存 文档 ， 按 Ctrl-X 退出 nano， 
这 样 对 .bashrc 文件 的 修改 就 完成 了 。 


11.3.4 ”激活 我 们 的 修改 


因为 只 有 在 启动 shell 会 话 时 才 会 读 取 .bashrc， 所 以 对 .bashre 做 出 的 修改 只 
有 在 关闭 shell 终端 会 话 并 重启 的 时 候 才 会 生效 。 当 然 也 可 以 使 用 以 下 命令 强制 
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命令 bash 重新 读 取 .bashrc 文件 。 
[me@linuxbox ~]$ source .bashre 


重新 读 取 .bashre 之 后 ， 文 件 中 做 出 的 修改 就 会 生效 。 我 们 来 试 一 下 其 中 的 
一 个 新 的 别名 。 


[me@linuxbox ~]$ 11 


”9 为 什么 注释 很 重要 

RE wy se ww 
的 习惯 。 我 们 可 以 记 住 近 期 做 出 的 修改 ， 但 是 6 个 月 之 前 的 修改 呢 ? 所 以 ， 
顺手 写 上 一 些 注释 吧 ， 二 Ry 
个 修改 记录 是 一 个 不 错 的 主意 . 
”在 shell 脚本 和 bash 启动 文件 中 ， 注释 是 以 be 开头 的 . 其 他 的 配置 广 
件 可 能 会 使 用 其 他 的 符号 。 大 多 数 了 于 文件 中 前 有 注释 ， 这 些 注释 能 起 到 很 
好 的 向 导 作用 .。 、 

在 配 轩 文件 直径 常会 看 到 一 些 代码 被 注 天 漳 ， 以 防止 它们 和 相 关 程 序 计 
取 , 这 是 为 了 给 读者 示 范 可 能 的 配置 和 顶 直 者 正 哺 的 配置 方法 ， 比 如 ，UDunn 
8.04 的 ,bashre 文件 包含 以 下 内 容 。 


# some more 1s aliases 、 

#alias 11='1s -1， 

#alias la='ls -A | 

#alias 1=' 1s CE 
最 后 三 行 被 注释 排 的 代码 定义 的 别名 是 有 效 的 . 如 果 将 这 三 行 代码 去 注 
释 化 ， 也 就 是 去 掉 开 头 的 “#” 符号， 那么 这 些 别名 将 被 激活 。 反之 ,如 果 在 

i 
类 数 。 


11.4 本 章 结尾 语 


本 章节 讲解 了 一 项 重要 的 基本 技能 一 一 使 用 文本 编辑 器 编辑 配置 文件 。 随 
着 学 习 的 继续 ， 当 我 们 查看 某 一 命令 的 man 文档 时 ， 记 录 下 该 命令 支持 的 环境 
变量 ， 可 能 会 有 有 趣 的 发 现 。 接 下 来 的 章节 会 讲 到 shell 函数 ，shell 函数 是 一 种 
强大 的 功能 , 用 户 可 将 其 添加 到 bash 启动 文件 中 , 以 此 来 添加 你 的 自 定义 命令 。 


*1 os 


VI 简介 


有 一 个 古老 的 笑话 ， 讲 的 是 一 个 观光 客 想 去 纽约 著名 的 古典 音乐 厅 ， 于 是 
找到 一 个 路 人 问 路 的 故事 。 


观光 客 :“ 不 好 意思 ， 请 问 怎样 才能 到 达 卡 耐 基 音 乐 厅 ? ” 
路 人 : “你 要 练习 ， 练习 ， 再 练习 1!1? 


就 像 一 个 人 不 可 能 一 夕 之 间 成 为 技艺 高 超 的 钢琴 家 ，Linux 命令 也 不 是 花 一 个 
下 午 就 能 熟练 掌握 的 ， 这 需要 很 长 时 间 的 练习 。 本 章节 将 介绍 UNIX 传统 核心 软件 
之 文本 编辑 器 vi (发 音 是 “vee eye”)。vi 用 户 界面 的 不 友好 是 非常 出 名 的 ， 
但 是 看 一 位 vi 专家 在 键盘 前 坐 下 并 开始 “演奏 ” 将 是 莫大 的 艺术 享受 。 本 章节 并 不 
能 使 读者 成 为 vi 专家 , 但 是 在 学 习 之 后 , 读者 至 少 能 够 做 到 在 vi 中 演奏 “Chopsticks ”。 


12.1 为 什么 要 学 习 亲 i 
现在 这 个 时 代 存 在 着 很 多 图 形 界面 编辑 器 和 易 用 的 基于 文本 的 编辑 器 ， 例 
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如 nano， 那 为 什么 还 要 学 习 vi? 这 有 三 条 充分 的 理由 。 


。 vi 总 是 可 用 的 。 如 果 用 户 面前 的 系统 没有 图 形 界面 ， 例 如 是 远程 服务 器 或 
者 是 本 地 系统 的 X 配置 不 可 用 ， 那 么 vi 就 会 成 为 救命 的 稻草 。 尽 管 nano 
已 经 得 到 了 越 来 越 广 泛 的 应 用 ， 但 是 ， 迄 今 为 止 它 还 不 是 通用 的 。 而 POSIX 
(一 种 UNIX 系统 的 程序 兼容 标准 〉 则 要 求 系统 必须 配备 有 vi。 


。 vi 是 轻 量 级 的 软件 ， 运 行 速度 快 。 对 很 多 任务 来 说 ， 启 动 vi 比 在 菜单 中 找 
到 一 个 图 形 界面 编辑 器 并 等 待 几 兆 大 小 的 编辑 器 载 入 要 容易 得 多 。 男 外 ， 
vi 的 设计 还 非常 利于 打字 。 在 接 下 来 的 讲解 中 读者 可 以 了 解 到 ，vi 高 手 在 
编辑 过 程 中 甚至 不 需要 把 手指 从 键盘 上 移 开 。 


。 用 户 不 想 被 其 他 Linux 和 UNIX 用 户 诚 视 。 
好 吧 ， 也 许 只 有 两 条 正当 的 理由 。 


12.2 VI 背景 


1976 年 ， 加 州 大 学 伯克利 分 校 的 学 生 ， 之 后 又 成 为 Sun 公司 创始 人 之 一 的 
Bill Joy 写 出 了 vi 的 第 一 个 版 本 。vi 出 自 单词 “visual”， 含 义 是 能 够 在 视频 终端 
上 用 移动 光标 来 进行 编辑 。 在 图 形 界面 编辑 器 出 现 之 前 是 行 编辑 器 的 天 下 ， 用 
户 每 次 只 能 在 一 行文 本 .上 进行 编辑 。 使 用 行 编辑 器 的 时 候 ， 用 户 需 要 告知 编辑 
器 是 在 哪 一 行进 行 什么 样 的 操作 ， 比 如 添加 或 者 删除 。 而 视频 终端 〈 而 非 基 于 
打印 机 的 终端 ， 比 如 电报 ) 的 来 临 使 得 全 屏幕 编辑 成 为 可 能 。 由 于 vi 融合 了 强 
大 的 行 编辑 器 ex，vi 用 户 也 可 以 同时 使 用 行 编辑 的 命令 。 


大 多 数 Linux 发 行 版 配备 的 并 不 是 真正 的 vi， 而 是 Bram Moolenaar 编写 的 
vi 加 强 版 一 一 vim (Vi Improved 的 缩写 )。vim 是 传统 UNIX 系统 中 vi 的 实质 性 
改良 版 。 通 常 ，vin 的 硬 连 接 〈 或 别名 ) 指向 Linux 系统 的 vi 名 称 。 接 下 来 的 讨 
论 就 是 建立 在 用 户 使 用 名 为 vi 的 vim 程序 这 样 一 个 假设 上 的 。 


12.3 ”启动 和 退出 vi 
输入 以 下 命令 启动 vi: 


[me@linuxbox ~]$ vi 
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屏幕 显示 如 下 : 


VIM - Vi Improved 


version 7.1.138 
by Bram Moolenaar et al. 
Vim is open source and freely distributable 


Sponsor Vim development! 
type :help sponsor<Enter> for information 


type :q<Enter> to exit 
type :help<Enter> or <F1> for on-line help 
type :help version7<Enter> for version info 


Running in Vi compatible mode 
type :set nocp<Enter> for Vim defaults 
type :help cp-default<Enter> for info on this 


[| 


像 操 作 nano 一 样 ， 现 在 应 该 先 学 习 如 何 退 出 vi。 输 入 以 下 命令 退出 vi( 需 
要 注意 的 是 ， 冒 号 是 命令 的 一 部 分 )。 


:9 
此 时 shell 会 返回 初始 的 操作 窗口 。 如 果 因 为 一 些 原因 ，vi 不 能 够 退出 〈 通 常 是 
因为 没有 保存 修改 过 的 文件 )， 可 以 通过 在 命令 后 添加 感叹 号 的 方式 强制 退出 vi。 


:q} 


注意 如 果 用 户 不 能 确定 vi 所 处 的 状态 ， 可 以 按 Esc 键 两 次 返回 初始 状态 。 


12.4 ”编辑 模式 
再 次 启动 vi, 并 向 其 传递 一 个 不 存在 的 文件 名 , 就 可 以 通过 vi 创建 新 文件 。 


[me@linuxbox ~]$ rm -f foo.txt 
tme@linuxbox ~]$ vi foo.txt 


正常 情况 下 ， 屏 幕 显示 如 下 所 示 。 
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[于 浅 尖 流 灶 暑 潮 攻 类 六 类 时 对 时 潮 时 江 攻 淹 室 类 省 让 米 尖 旷 尖 计 基 攻 拓 时 到 时 | 


"foo.txt* [New File] 


每 行 开头 的 波浪 线 代表 此 行 没有 任何 内 容 ， 也 就 是 说 现在 foo 是 宝 晶 的 文件。 
先 不 要 输入 任何 内 容 ! 


讲解 过 如 何 退 出 vi 之 后 ， 接 下 来 需要 了 解 的 就 是 vi 是 一 个 模 态 编辑 器 。vi 
启动 后 进入 的 是 命令 模式 。 在 命令 模式 中 ， 几 乎 键盘 上 的 每 一 个 按键 都 代表 一 
条 命令 ， 所 以 在 这 时 对 vi 进行 普通 输入 的 话 ，vi 基本 上 就 要 崩溃 了 ， 并 且 会 把 
文件 弄 得 一 团 糟 。 


12.4.1 进入 插入 模式 


如 果 用 户 需 要 向 文件 中 添加 一 些 内 容 ， 那 么 首先 要 做 的 就 是 按 I1 键 (或 让 ) 
进入 插入 模式 。 若 此 时 vim 是 在 增强 模式 下 正常 地 运行 ， 那 么 在 屏幕 底部 会 出 
现 以 下 内 容 〈 若 vim 以 兼容 模式 运行 ， 则 不 会 出 现 ): 

-- INSERT -- 


现在 用 户 可 以 进行 输入 操作 了 ， 例 如 : 


The quick brown Tox jumped over the lazy dog. 


最 后 按 Esc 键 退 出 插入 模式 并 返回 命令 模式 。 


12.4.2 ”保存 工作 


要 保存 用 户 修改 过 的 文件 ， 在 命令 模式 下 输入 一 条 ex 命令 ， 也 就 是 按 “:” 
键 。 这 样 之 后 ， 一 个 冒号 会 出 现在 屏幕 的 底部 : 


要 将 文件 写 入 硬盘 ， 在 冒号 之 后 输入 w， 如 下 所 示 : 
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文件 写 入 硬盘 驱动 器 之 后 ， 用 户 会 在 屏幕 底部 得 到 一 条 确认 信息 。 


"foo.txt" [New] 1L，46C written 


注意 如 果 用 户 阅读 vim 的 说 明文 档 ， 会 困惑 地 发 现 命令 模式 被 称 为 普通 模式 ， 
而 使 用 ex 命令 则 被 称 为 命令 模式 。 这 方面 需 多 加 留意 。 


兼容 模式 

在 前 面 示例 的 vi 启动 屏幕 ( 取 自 Ubuntu 8.04 版 本 ) 中 ,用户 可 以 看 到 这 
. 样 的 内 容 : Running in Vi compatible mode。 这 意味 着 vim 将 以 近似 于 vi 的 常 
规模 式 运行 ， 而 不 是 加 强 版 的 vim 行为 。 为 达到 本 章 的 目的 ， 用 户 需要 使 用 
加 强 模式 下 的 vim。 以 下 两 种 方式 都 可 以 达到 此 目的 。 
e。 运行 vim 而 不 是 vi 人 eene ae 可 以 考虑 在 .bashrc He 

Vi='vim' )。 

。 使 用 以 下 命令 在 vim 配置 文件 中 添加 一 行内 容 。 


echo "set nocp" >> -/.vimre 


Linux 发 行 版 本 不 同 , 其 vim 包 也 就 不 同 . 一 些 版 本 在 默认 情况 下 只 是 安 
装 了 vim 的 最 小 版 本 ， 只 支持 有 限 的 vim 特性 。 在 接 下 来 的 讲解 中 ， 可 能 会 
用 到 vim 特性 缺少 的 情况 。 如 果 是 这 样 的 话 ， 你 可 安装 一 个 完全 版 的 vim 


12.5 移动 光标 


在 命令 模式 下 ，vi 提供 了 很 多 移动 光标 命令 ， 其 中 有 一 些 命令 是 与 less 命 
令 共用 的 。 表 12-1 列 出 了 命令 的 一 部 分 。 


表 12-1 光标 移动 功能 键 


键 光标 动作 
工 或 右 方向 键 右 移 一 位 
于 或 左 方向 键 左 移 一 位 
J 或 下 方向 键 下 移 一 行 
K 或 上 方向 键 上 移 一 行 


数字 0 : 至 本 行 开头 
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续 表 
键 光标 动作 
Shift-6(^) 至 本 行 第 一 个 非 空 字符 
Shift-4($) 至 本 行 的 末尾 
Ww 至 下 一 单词 或 标点 的 开头 
Shift-W(W) 至 下 一 单词 的 开头 ， 忽 略 标 点 
B 至 上 一 单词 或 标点 的 开头 
Shift-B(B) 至 上 一 单词 的 开头 ， 忽 略 标点 
Ctrl-F 或 Page Down 下 翻 一 页 
Ctrl-B 或 Page UP 上 翻 一 页 
number-Shift-G 圣 第 number 行 《 如 1G 会 将 光标 移 到 文件 的 第 一 行 ) 
Shift-G(G) 至 文件 的 最 后 一 行 


为 什么 使 用 也、 J、K 和 工 键 来 移动 光标 呢 ? 这 是 因为 在 Vi 最 初出 现 的 阶段 ， 
并 不 是 所 有 的 视频 终端 都 有 方向 键 ， 这 样 的 设计 使 得 vi 高 手 可 以 手 不 离 键盘 地 
移动 光标 。 

像 表 12-1 的 G 命令 一 样 ， 许 多 vi 的 命令 的 前 面 都 可 以 缀 上 数字 。 前 缀 数字 
可 以 控制 命令 执行 的 次 数 ， 比 如 5j 可 以 使 得 光标 下 移 5 行 。 


12.6 基本 编辑 


插入 、 删 除 、 剪 切 、 复 制 等 构成 了 基本 的 文本 编辑 操作 ，vi 也 以 其 特殊 的 
方式 支持 这 些 操作 。 同 时 vi 还 支持 有 限 形 式 的 撤销 操作 ， 在 命令 模式 下 按 U 键 
就 可 以 撤销 用 户 最 后 一 步 操 作 。 这 项 功能 在 学 习 一 些 编辑 命令 的 时 候 会 很 有 
帮助 。 


12.6.1 添加 文本 


有 几 种 方式 都 可 以 进入 vi 的 插入 模式 。 现 在 假设 已 经 使 用 i 命令 进入 插入 
模式 。 
先 回顾 下 foo.txt 内 容 。 


The quick brown fox jumped over the lazy dog . 


因为 光标 不 能 跳出 行 末 ， 所 以 单纯 使 用 i 命令 并 不 能 完成 在 文本 末尾 添加 内 
容 的 任务 。 为 此 vi 提供 了 在 行 末 添 加 文本 的 a 命令 。 当 用 户 将 光标 移动 到 行 的 
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末尾 并 使 用 a 命令 时 ， 光 标 就 会 越过 文本 的 末尾 ， 同 时 vi 进入 插入 模式 。 这 样 
用 户 就 可 以 在 行 末 添 加 文本 了 。 


The quick brown fox jumped over the lazy dog, It was cool. 

输入 结束 后 不 要 忘记 按 Esc 键 退出 插入 模式 。 

因为 用 户 经 常用 到 在 行 末 添 加 文本 的 功能 , 所 以 vi 提供 了 使 光标 移动 到 行 
末 并 进入 插入 模式 的 快捷 方式 一 一 A 命令 。 现 在 我 们 就 来 试 一 下 。 

首先 ， 使 用 0 命令 将 光标 移动 到 行 的 开头 。 接 下 来 使 用 A 命令 将 以 下 内 容 
写 入 文件 中 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


按 Esc 键 退 出 插入 模式 。 
可 以 看 到 , A 命令 使 vi 进入 插入 模式 并 自动 将 光标 移动 到 行 尾 , 非常 好 用 。 


12.6.2 插入 一 行 


插入 文本 的 另 一 种 方式 是 在 文本 中 重 开 一 行 ， 即 在 两 行 现存 的 文字 中 间 插 
入 空白 行 并 进入 插入 模式 。 表 12-2 列 出 了 插入 一 行 的 两 种 方式 。 


表 12-2 插入 一 行 功能 键 


命令 开行 
0 当前 行 的 上 方 
O 当前 行 的 下 方 


下 面 这 个 例子 示范 了 这 两 种 命令 的 作用 。 先 将 光标 置 于 Line 3， 再 输入 o， 
结果 如 下 所 示 。 
The quick brown fox jumped over the lazy dog. It was cool. 


Line 2 
Line 3 


Line 4 
Line 5 


我 们 可 以 看 到 在 第 三 行 的 下 方 vi 插入 了 一 行 ， 并 进入 了 插入 模式 。 按 Ese 
键 退 出 插入 模式 ， 按 u 键 取 消 上 述 操作 。 
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12.6.3 


继续 输入 命令 o， 就 会 在 第 三 行 的 上 方 插入 了 一 行 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 


Line 3 


Line 4 
Line 5 


再 次 按 Esc 键 退出 插入 模式 并 按 u 键 取 消 操 作 。 


删除 文本 


就 像 用 户 期 望 的 一 样 ，vi 提供 了 很 多 种 删除 文本 的 方式 ， 每 一 种 都 需要 进 
行 一 次 至 两 次 的 按键 操作 。 首 先 ，X 键 会 删除 光标 处 的 字符 。x 命令 可 加 以 数字 
前 缀 来 明确 删除 的 字符 数目 。D 键 则 使 用 得 更 加 普遍 。 像 x 命令 一 样 ，d 命令 也 
可 加 练 数 字 前 缀 来 明确 删除 的 次 数 。 另 外 ，d 命令 总 是 加 以 控制 删除 范围 的 光标 
移动 命令 作为 后 级 。 表 12-3 给 出 了 一 些 范例 。 


现在 我 们 进行 命令 练习 。 我 们 将 光标 移 至 文件 首 行 单词 It 的 首 字母 ， 使 用 
x 命令 直到 完全 删除 本 句 。 然 后 按 v 键 直到 所 有 的 删除 操作 都 被 取消 为 止 。 


实际 上 ，vi 只 能 取消 一 次 操作 ，vim 可 取消 多 次 操作 。 


表 12-3 文本 删除 命令 


命令 删除 内 容 

x 当前 字符 

3x 当前 字符 和 之 后 2 个 字符 
dd 当前 行 

sdd 当前 行 和 之 后 4 行 

dW 当前 字符 到 下 一 单词 的 起 始 
d$ 当前 字符 到 当前 行 的 末尾 
d0 当前 字符 到 当前 行 的 起 始 
d^ 当前 字符 到 当前 行 下 一 个 非 空 字符 
dG 当前 行 到 文件 末尾 

d20G 当前 行 到 文件 第 20 行 


现在 让 我 们 练习 使 用 d 命令 。 我 们 再 次 将 光标 移动 到 单词 t， 使 用 dW 命令 
来 删除 整个 单词 。 


The quick brown fox jumped over the lazy dog，was cool. 


Line 2 
Line 3 
Line 4 
Line 5 


使 用 的 d$ 删 除 光 标 至 本 行 末 尾 的 字符 。 


The quick brown fox jumped over the lazy dog. 
Line 2 
Line 3 
Line 4 
Line 5 


使 用 dG 删除 当前 行 到 文件 末尾 的 内 容 。 


1 


使 用 uu 命令 三 次 来 取消 以 上 操作 。 


12.6.4 剪 切 、 复 制 和 粘贴 文本 
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命令 d 不 只 是 删除 文本 ， 而 是 在 “ 剪 切 ”文本 。 用 户 每 次 使 用 d 命令 之 后 ， 
都 会 复制 删除 的 内 容 进 缓存 〈 类 似 剪贴 板 )， 然 后 用 户 就 可 以 使 用 p 命令 将 缓存 
中 的 内 容 粘 贴 到 光标 之 后 或 使 用 P 命令 将 内 容 粘 贴 到 光标 之 前 。 


就 像 命 令 d 剪 切 文本 的 形式 一 样 ， 命 令 y 会 “复制 ”文本 。 表 12-4 列举 了 


一 些 y 命令 与 光标 移动 命令 共同 作用 的 范例 。 
表 12-4 复制 命令 


命令 ”复制 内 容 

yy 、 当前 行 

Syy 当前 行 和 之 后 4 行 

yW 当前 字符 到 下 一 单词 的 起 始 

y$ 当前 字符 到 当前 行 的 末尾 

y0 当前 字符 到 当前 行 的 起 始 

7 当前 字符 到 当前 行 下 一 个 非 空 字符 
yG 当前 行 到 文件 末尾 

y20G 当前 行 到 文件 第 20 行 


现在 让 我 们 来 练习 一 下 复制 和 粘贴 。 我 们 将 光标 移 至 文本 的 第 一 行 ， 使 用 
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yy 命令 复制 当前 行 。 接 下 来 ， 将 光标 移 至 最 后 一 行 (G)， 使 用 p 命令 将 复制 的 
内 容 粘贴 到 当前 行 的 下 方 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 
The quick brown fox jumped over the lazy dog. It was cool. 


命令 u 会 取消 我 们 的 操作 。 将 光标 移 至 文件 的 最 后 一 行 , 输入 p 命令 将 文 
本 粘贴 到 当前 行 的 上 方 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
The quick brown fox junped over the lazy dog. It was cool. 
Line 5 


将 表 12-4 中 的 其 他 命令 都 练习 一 下 ， 以 实际 了 解 p 命令 和 了 命令 的 作用 。 练 
习 结束 后 ， 将 文件 恢复 到 本 来 的 样子 。 


12.6.5 ”合并 行 


vi 在 行 的 概念 上 非常 严格 。 通 常 来 说 ， 将 光标 移动 到 行 的 末端 并 删除 行 的 
末尾 字符 并 不 能 将 此 行 与 下 一 行 合并 。 因 此 ，vi 专门 提供 了 J 命令 (不 要 与 移动 
光标 的 j 命令 混淆 ) 来 合并 行 。 

若 将 光标 置 于 第 3 行 并 输入 J 命令 ， 将 得 到 如 下 所 示 的 结果 。 

The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 


Line 3 Line 4 
Line 5 


12.7 查找 和 替换 


vi 提供 了 在 一 行 或 者 整个 文件 中 ， 根 据 搜索 条 件 将 光标 移动 至 指定 位 置 的 
功能 。vi 还 可 以 执行 文本 替换 工作 ， 用 户 可 指定 替换 时 是 否 需要 用 户 确 认 。 
12.7.1 行内 搜索 


命令 f 在 行内 进行 搜索 ， 并 将 光标 移 至 搜索 到 的 下 一 个 指定 字符 。 比 如 ， 命 令 
鱼 就 会 将 光标 移动 到 本 行 下 一 处 出 现 字 符 a 的 地 方 .在 执行 过 一 次 行内 搜索 之 后 ， 
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输入 分 号 可 以 使 vi 重复 上 一 次 搜索 。 


12.7.2 ”搜索 整个 文件 
同 第 3 章 中 讲解 过 的 less 程序 一 样 ， 命 令 “/” 可 以 完成 对 单词 或 短语 的 搜 
索 。 当 用 户 使 用 “/” 命 令 后 ， 一 个 “/” 符 号 会 出 现在 屏幕 的 底部 。 接 下 来 ， 输 
入 需要 搜索 的 单词 或 短语 ， 以 Enter 结束 。 光标 就 会 移动 到 下 一 处 包含 被 搜索 字符 
串 的 地 方 。 使 用 n 命令 可 以 重复 此 搜索 。 如 下 例 所 示 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


将 光标 移 至 文件 的 第 一 行 ， 并 输入 如 下 代码 。 
/Line 


输入 Enter 以 结束 ， 光 标 将 移动 至 第 2 行 。 接 下 来 ， 输 入 n， 光 标 将 继续 移 
动 至 第 3 行 。 重复 输入 n 直至 光标 移动 到 文档 的 最 后 , 且 找 不 到 符合 条 件 的 字符 
串 。 尽 管 现在 只 讲解 到 vi 的 单词 和 词组 的 搜索 模式 ， 但 是 vi 同样 支持 正则 表 
达 式 《一 种 强大 的 表达 复杂 文本 模式 的 方法 ) 的 应 用 。 第 19 章 将 会 讲解 这 
方面 的 内 容 。 


12.7.3 ”全 局 搜索 和 替换 


vi 使 用 ex 命令 来 执行 几 行 之 内 或 者 整个 文件 中 的 搜索 和 替换 操作 。 输 入 以 
下 命令 可 将 文件 中 的 Line 替换 为 line。 


:%s/Line/line/g 
现在 就 来 解析 这 条 命令 每 一 部 分 的 功能 〈 见 表 12-5)。 


表 12-5 ”全 局 搜索 和 替换 语法 范例 
组 成 含义 
分 号 用 于 启动 一 条 ex 命令 


确定 了 操作 作用 的 范围 。% 简 洁 地 代表 了 从 文件 的 第 1 行 到 最 后 1 行 。 本 命令 的 
范围 还 可 以 表示 为 1,5〔 因 为 本 文件 只 有 5 行 )， 或 者 是 1$， 意 思 是 “从 第 1 行 
到 文件 的 最 后 一 行 "。 如 果 不 明确 指出 命令 的 作用 范围 ， 那 么 命令 只 会 在 当前 行 
生效 


% 


s 指定 了 具体 的 操作 一 一 本 次 是 痊 换 操作 搜索 和 替换 ) 
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续 表 
组 成 含义 
/Line/line 搜索 和 替换 的 文本 
代 指 global (全 局 )， 也 就 是 说 对 搜索 到 的 每 一 行 的 每 一 个 实例 进行 替换 。 如 果 g 
缺失 ， 那 么 只 替换 每 一 行 第 一 个 符合 条 件 的 实例 


以 下 是 执行 过 查找 和 替换 命令 之 后 的 文档 内 容 。 


The quick brown fox jumped over the lazy dog. It was cool. 
line 2 
line 3 
line 4 
line 5 


在 命令 末尾 添加 c， 则 命令 在 每 次 替换 之 前 都 会 请 求 用 户 确认 。 如 下 所 示 。 
:%8/1line/Line/gc 


此 命令 将 会 将 文件 替换 回 原来 的 样子 ， 但 是 每 次 替换 前 ，vi 都 会 停 下 来 询问 
用 户 是 否 确认 执行 替换 。 


replace with Line {y/n/a/q/1/“E/“^Y)? 


圆 括号 中 的 每 一 个 字符 都 是 一 种 可 能 的 回答 ， 表 12-6 具体 阐述 了 每 一 个 字 


符 的 含义 。 
表 12-6 替换 确认 功能 键 
功能 键 行为 
y 执行 替换 
n 跳 过 此 次 替换 
a 执行 此 次 替换 和 之 后 的 所 有 替换 
q 或 者 ESC 停止 蔡 换 
1 执行 此 次 替换 并 退出 替换 。 是 last 的 缩写 
Ctrl-E, Ctrl-Y 分 别 是 向 下 滚动 和 向 上 滚动 ， 能 用 于 查看 替换 处 的 上 下 文 


12.8 ”编辑 多 个 文件 


用 户 经 常 遇 到 需要 同时 编辑 多 个 文件 的 情况 。 可 能 是 需要 对 多 个 文件 作出 
修改 ， 或 者 是 拷贝 文件 的 部 分 内 容 到 另 一 个 文件 。 用 户 可 以 通过 在 命令 行 具体 
指定 多 个 文件 的 方式 使 vi 打开 多 个 文件 。 


vi file1 file2 file3... 
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现在 退出 所 处 的 vi 会 话 ， 并 创建 一 个 用 于 编辑 的 新 文件 。 输 入 :wq 来 退出 
vi 并 保存 做 出 的 修改 。 接 下 来 ， 使 用 ls 命令 的 部 分 输出 在 主 目录 创建 一 个 用 于 
实验 的 新 文件 。 
Teelinuxbox -J$ 1s -1 /usr/bin > 13-0utput-txt 
现在 就 用 vi 来 同时 编辑 旧 文 件 和 新 文件 。 
[me@linuxbox -~]$ vi foo.txt ls-output.txt 


vi 启动 后 ， 屏 幕 显示 内 容 如 下 所 示 。 


The quick brown fox jumped over the lazy dog. It was C001. 
Line 2 
Line 3 
Line 4 
Line 5 


12.8.1 切换 文件 
使 用 以 下 ex 命令 来 从 一 个 文件 切换 到 下 一 个 文件 。 


切换 回 上 一 个 文件 。 


当 用 户 从 一 个 文件 切换 到 另 一 个 的 时 候 ，vi 要 求 用 户 必 须 先 保存 对 当前 文 
件 做 出 的 修改 才能 切换 到 其 他 文件 。 若 要 放弃 对 文件 的 修改 并 使 vi 强制 切换 到 
另 一 个 文件 ， 可 在 命令 后 添加 感叹 号 〈1!1)。 


除了 以 上 描述 的 切换 方法 之 外 ，vim〈 和 一 些 版 本 的 vi) 还 提供 了 一 些 ex 
命令 让 用 户 可 以 更 轻松 地 编辑 多 个 文本 。 用 户 可 使 用 :buffers 命令 来 查看 正在 编 


辑 的 文件 列表 。 

:buffers 
1 %a "foo.txt" line 1 
2 "ls-output .txt" line 0 


Press ENTER or type command to continue 


输入 :buffer 加 文件 (buffer) 编号 可 切换 到 另 一 个 文件 (buffer)。 如 从 文件 
1 (footxt) 切换 到 文件 2 (1s-output.txt)， 用 户 应 当 输 入 如 下 命令 。 


:buffer 2 


现在 屏幕 展示 的 就 是 文件 2 的 内 容 了 。 
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12.8.2” 载 入 更 多 的 文件 


我 们 也 可 以 在 现 有 的 编辑 会 话 中 载 入 更 多 的 文件 。 使 用 ex 命令 :e (edit 的 缩 
写 ) 加 文件 名 可 以 载 入 另 一 个 文件 。 先 退出 现 有 的 编辑 会 话 并 回 到 命令 行 模式 。 


重启 vi， 并 只 打开 一 个 文件 。 
[me@linuxbox ~]$ vi foo.txt 

添加 一 个 文件 到 编辑 会 话 中 ， 输 入 下 列 代码 。 
:e ls-output. txt 


屏幕 将 展示 第 二 个 文件 的 内 容 ， 而 第 一 个 文件 仍然 处 在 编辑 状态 ， 可 使 


用 :buffers 命令 来 证 实 。 

:buffers 
1 # "foo.txt" line 1 
2 %a "ls-output .txt" line 0 


Press ENTER or type command to continue 


注意 使 用 :ez 载 入 的 文件 不 会 响应 :n 或 者 :N 命令 , 而 需 使 用 :buffer 加 文件 编号 
来 切换 文件 。 


12.8.3 ”文件 之 间 的 内 容 复制 
用 户 在 编辑 多 个 文件 的 过 程 中 ， 有 时 会 需要 将 一 个 文件 中 的 一 部 分 复制 到 
另 一 个 文件 中 。 使 用 之 前 使 用 过 的 复制 和 粘贴 命令 即 可 完成 此 功能 ， 示 范 如 下 。 
首先 ， 在 载 入 的 两 个 文件 中 ， 切 换 到 文件 1 (foo.txt)。 
:buffer 1 


此 时 屏幕 显示 如 下 所 示 。 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


接 下 来 ， 将 光标 移动 到 文件 的 第 一 行 并 输入 yy 命令 来 复制 第 一 行 。 
输入 如 下 命令 以 切换 到 文件 2。 


:buffer 2 


第 12 章 VI 简 介 133 


现在 屏幕 将 会 展示 一 份 文件 列表 ， 如 下 所 示 〔〈 这 里 只 展示 了 一 小 部 分 )。 


total 343700 


-rwxr-xr-x 1 root root 31316 2011-12-05 08:58 [ 
-rwxr-xr-x 1 root root 8240 2011-12-09 13:39 411toppm 
-rwxr-xr-x 1 root root 111276 2012-01-31 13:36 a2p 
-rwxr-xr-x 1 root root 25368 2010-10-06 20:16 a52dec 
-rwxr-xr-x 1 root root 11532 2011-05-04 17:43 aafire 
-rwxr-xr-x 1 root root 7292 2011-05-04 17:43 aainfo 
将 光标 移动 到 文件 的 第 一 行 并 使 用 p 命令 将 从 文件 1 复制 的 内 容 粘贴 到 本 
文件 。 


total 343700 
The quick brown fox junped over the lazy dog. It was cool. 


-rwWxr-xr-x 1 root root 31316 2011-12-05 08:58 [ 
-rwxr-xr-x 1 root root 8240 2011-12-09 13:39 411toppnm 
-rwxr-xr-x 1 root root 111276 2012-01-31 13:36 a2p 
-rwxr-xr-x 1 root root 25368 2010-10-06 20:16 a52dec 
-rwxr-xr-x 1 root root 11532 2011-05-04 17:43 aafire 
-rwWxr-xr-x 1 root root 7292 2011-05-04 17:43 aainfo 


12.8.4 ”插入 整个 文件 


用 户 还 可 以 将 一 个 文件 完全 插入 正在 编辑 的 文件 中 。 为 了 实际 演示 这 项 功 
能 ， 先 结束 现 有 的 vi 会 话 并 重启 vi 的 同时 只 打开 一 个 文件 。 


[me@linuxbox ~]$ vi ls-output.txt 
屏幕 将 再 次 显示 一 份 文件 列表 。 


total 343700 


-rwxr-xr-x 1 root root 31316 2011-12-05 08:58 [ 
-rwxr-xr-x 1 root root 8240 2011-12-09 13:39 411toppm 
-Fwxr-xr-x 1 root root 111276 2012-01-31 13:36 a2p 
-TWwxr-xr-x 1 root root 25368 2010-10-06 20:16 a52dec 
-rwxr-xr-x 1 root root 11532 2011-05-04 17:43 aafire 
-PWXr-Xr-x 1 root root 7292 2011-05-04 17:43 aainfo 


将 光标 移动 到 文件 的 第 三 行 并 输入 如 下 ex 命令 。 


:rr foo.txt 
命令 :rread 的 缩写 ) 将 指定 的 文件 内 容 插 入 到 光标 位 置 之 前 。 现 在 的 屏幕 
显示 如 下 所 示 。 
total 343700 
-Pwxr-xr-x 1 Foot root 31316 2011-12-05 08:58 [ 
-PWxr-xr-x 1 root root 8240 2011-12-09 13:39 411toppm 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 “ 
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Line 3 

Line 4 

Line 5 

-rwxr-xr-x 1 root root 111276 2012-01-31 13:36 a2p 
-rwxr-xr-x 1 root root 25368 2010-10-06 20:16 a52dec 
-Wxr-xr-x 1 root root 11532 2011-05-04 17:43 aafire 
-rwWxr-xr-x 1 root root 7292 2011-05-04 17:43 aainfo 


12.9 保存 工作 
就 像 其 他 功能 一 样 ，vi 提供 了 很 多 种 方式 来 保存 编辑 过 的 文件 。 前 面 的 章节 
已 经 介绍 过 用 于 此 功能 的 ex 命令 :w， 但 是 还 有 一 些 其 他 可 用 的 方法 。 


在 命令 模式 下 ， 输 入 ZZ 将 保存 当前 文档 并 退出 vi。 同 样 的 ，ex 命令 :wq 
组 合 了 :w 和 :q 这 两 个 命令 的 功能 ， 能 够 保存 文件 并 退出 vi。 


当 命 令 :w 指定 一 个 随意 的 文件 名 时 ， 命 令 的 功能 就 类 似 于 “另存 为 ” 例如， 
用 户 在 编辑 foo.txt 的 时 候 想 要 将 其 另存 为 fool.txt， 那 么 就 可 以 输入 如 下 内 容 。 


:Ww fool.txt 


注意 此 命令 在 以 新 名 称 保存 文件 的 同时 ， 并 不 更 改编 辑 中 的 原文 件 的 名 称 。 当 
用 户 继续 编辑 时 ， 编 辑 的 还 是 foo.txt 而 不 是 fool .txt。 
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定制 提示 符 


本 章 将 会 讲解 一 个 看 似 微不足道 的 细节 : shell 提示 符 。 通 过 讲解 ， 我 们 会 
发 现 shell 和 终端 仿真 器 程序 的 内 部 工作 机 制 。 

和 Linux 中 的 很 多 程序 一 样 ，shell 提示 符 的 可 配置 性 很 高 。 尽 管 大 多 数 用 
户 并 不 重视 提示 符 ， 但 是 ， 一 旦 我 们 学 会 了 怎样 控制 它 ， 它 就 会 成 为 一 种 相当 有 
用 的 设备 。 


13.1 提示 符 的 分 解 
系统 的 默认 提示 符 看 起 来 如 下 所 示 。 


[me@linuxbox -1$ 

可 以 看 到 提示 符 中 包含 了 用 户 名 、 主 机 名 和 当前 的 工作 目录 ， 但 是 为 什么 
提示 符 是 这 个 样子 的 呢 ? 很 简单 ， 提 示 符 就 是 这 样 定义 的 。 提 示 符 是 由 名 为 PS1 
(prompt string 1 的 缩写 ， 即 提示 符 字 符 串 1) 的 环境 变量 定义 的 。echo 命令 可 
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以 帮助 用 户 看 到 PS1 的 值 。 


[me@linuxbox ~]$ echo $PS1 


[\uve\h \WI\$ 


如 果 输 出 的 结果 同 本 书 的 范例 不 同 ， 也 不 需要 担心 。 每 一 个 Linux 发 行 版 


本 对 此 提示 符 字符 串 的 定义 都 会 有 所 不 同 ， 有 一 些 甚至 定义 得 很 奇怪 。 


可 以 看 出 , PS1 包含 了 一 些 提示 符 中 出 现 的 符号 ， 比 如 方 括号 、@ 符 号 和 美 
元 符号 ， 但 是 其 余 的 部 分 则 很 令 人 困惑 。 聪 明 的 读者 会 将 这 些 符号 与 表 7-2 中 
所 示 的 由 反 斜 杠 转 义 的 特殊 字符 联系 起 来 。 


表 13-1 
转 义 字符 


shell 提示 符 中 使 用 的 转 义 字符 


含义 


\a 
\d 


ASCII 铃声 。 在 遇 到 该 转 义 字符 时 ， 计 算 机 发 出 哗 哗 声 
当前 日 期 ， 以 星期 、 月 、 日 的 形式 表示 ， 如 “Mon May 26” 
本 地 机 器 的 主机 名 ， 但 是 不 带 域名 

完整 的 主机 名 

当前 shell 会 话 中 进行 的 任务 个 数 

当前 终端 设备 的 名 称 

换行 符 

回 车 符 

shell 程序 的 名 称 

当前 时 间 〈24 小 时 制 )， 格 式 为 小 时 ， 分 钟 : 秒 

当前 时 间 (12 小 时 制 ) 

当前 时 间 〈12 小 时 制 ， 格 式 为 AMAPM 

当前 (24 小 时 制 )， 格 式 为 小 时 : 分 钟 
当前 用 户 的 用 户 名 

shell 的 版 本 号 

shell 的 版 本 号 和 发 行 号 

当前 工作 目录 名 

当前 工作 目录 名 称 的 最 后 一 部 分 

当前 命令 的 历史 编号 

当前 shell 会 话 中 输入 的 命令 数 

在 非 管理 员 权限 下 输出 “$”。 在 管理 员 权 限 下 输出 “#?” 


标志 一 个 或 多 个 非 打印 字符 序列 的 开始 。 用 于 嵌入 非 打 印 的 控制 字符 ， 
使 其 以 一 定 方式 操纵 终端 仿真 器 ， 比 如 移动 光标 或 更 改 文本 颜色 


标志 着 非 显 示 字符 序列 的 结束 
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13.2 ”尝试 设计 提示 符 
通过 这 个 特殊 字符 列表 , 我 们 可 以 更 改 提 示 符 来 查看 效果 。 我 们 首先 备份 现 
有 的 字符 串 ， 以 便 过 后 进行 恢复 。 为 此 ， 将 现 有 的 字符 串 复制 到 我 们 创建 的 另外 
一 个 shell 变量 中 。 
. [me@linuxbox ~]$ ps1_01d="$PS1" 


这 样 我 们 就 创建 了 名 为 ps1_old 的 新 变量 ， 并 将 PS1 的 值 赋 给 了 psl_old。 我 
们 可 以 使 用 echo 命令 来 验证 PS1 的 值 确实 已 经 被 复制 了 。 


[me@linuxbox ~1$ echo $ps1_o1ld 
[\uevh \W]\$ 


在 终端 会 话 中 , 用 户 随时 可 以 通过 这 个 过 程 的 逆 操 作 来 复原 最 初 的 提示 符 。 
[meelinuxbox ~]$ PS1="$ps1 01d。 

现在 一 切 准备 就 绪 。 接 下 来 让 我 们 看 看 如 果 提 示 符 为 空 会 发 生 什 么 。 
[me@linuxbox ~]$ PS1= 


车 提示 符 为 空 ， 那 么 用 户 不 会 得 到 任何 提示 。 根 本 就 没有 提示 字符 串 旷 ! 
尽管 提示 符 就 在 那里 ， 但 是 系统 并 不 会 显示 。 这 样 的 提示 看 起 来 很 令 人 困惑 ， 
所 以 现在 将 提示 符 设 置 为 最 简略 的 内 容 。 


PS1="\$ " 

这 样 就 好 多 了 ， 至 少 现在 用 户 知道 自己 在 做 什么 了 。 可 以 注意 到 双 引 号 中 
末尾 的 空格 。 当 显示 提示 符 时 ， 这 个 空格 会 把 美元 符号 和 光标 分 隔 开 。 

在 提示 符 中 添加 一 个 铃声 。 
$ PS1="\a\$ " 

这 样 以 来 ， 每 当 系 统 显 示 提 示 符 的 时 候 ， 用 户 都 会 昕 到 哗 哗 声 。 虽 然 这 可 
会 使 用 户 感到 厌烦 ， 但 是 在 一 些 情况 下 可 能 会 很 有 帮助 ， 比 如 可 以 在 一 个 耗 
时 特别 长 的 命令 执行 完毕 时 通知 用 户 。 

接 下 来 ， 我 们 试 着 创建 一 个 信息 丰富 的 提示 符 ， 其 中 包括 主机 名 和 当天 的 
时 间 信 息 。 


$ PS1="\A \h \$ * 
17:33 linuxbox $ 


138 ”Linux 命令 行 大 全 


如 果 我 们 需要 记录 某 些 任务 的 执行 时 间 ， 在 提示 符 中 添加 时 间 信 息 会 比 
较 有 用 。 最 后 ， 我 们 定制 一 个 类 似 于 最 初 样式 的 提示 符 。 


17:37 linuxbox $ PS1="<\u@\h \W>\$ " 
<meelinuxbox ~>$ 


用 户 可 以 尝试 使 用 表 13-1 中 其 他 的 序列 ， 看 看 能 不 能 创造 出 一 个 奇妙 的 新 
提示 符 。 


13.3 ”添加 颜色 


大 多 数 终 端 都 会 响应 某 些 非 打印 字符 序列 , 来 控制 光标 位 置 、 字 符 属性 (如 
颜色 、 粗 体 、 文 本 闪烁 等 ) 等 内 容 。 本 章 稍 后 会 讲解 光标 位 置 ， 现 在 先 来 讲解 
颜色 。 


混乱 的 终端 
Rn an 
多 种 不 同 品牌 的 终端 机 ， 并 且 每 一 种 都 以 不 同 的 方式 工作 。 这 些 终端 的 键盘 
不 同 ， 对 控制 信息 的 诠释 方式 也 不 同 。 UNIX 和 类 UNIX 系统 都 配备 有 两 种 非 
常 复杂 的 子 系统 (分 别 叫 做 termeap 和 terminfo ) 来 处 理 终端 控制 领域 的 混 
乱 局 面 。 如 果 你 吉 间 ”风光 仿 自 蝇 要 度 必 的 属 性 设置 ， wono 
于 终端 仿真 器 类 型 的 设置 . 
为 了 使 所 有 的 终端 都 使 用 同一 神通 用 语言 ,美国 国家 标准 委员 会 (ANSI) 
开发 了 一 套 标 准 的 字符 序列 ， 来 控制 视频 终端 。 使 用 过 DOS 户 一 定 会 
记得 用 来 启用 这 些 代码 解释 的 ANSISYS 文件 . 


字符 颜色 是 由 发 送 到 终端 仿真 器 的 一 个 ANSI 转 义 代码 来 控制 的 ， 该 转 义 
代码 氮 入 到 了 要 显示 的 字符 流 中 。 控 制 代码 不 会 “打印 ”到 屏幕 上 ， 而 是 被 被 
终端 解释 为 一 条 指令 。 在 表 13-1 中 可 以 看 到 ,，“\[” 和 “\]” 这 两 个 序列 用 来 封 
装 非 打 印字 符 串 。 一 个 ANSI 转 义 代码 以 八进制 033( 该 代码 由 转 义 键 [escape key] 
产生 ) 开始 ， 后 面 跟着 一 个 可 选 的 字符 属性 ， 之 后 是 一 条 指令 。 例 如 ， 将 文本 
颜色 设置 为 正常 〈attribute = 0)、 黑 色 的 代码 是 \033[0;30m。 


表 13-2 列 出 了 可 用 的 文本 颜色 。 需 要 注意 的 是 ， 这 些 颜色 分 为 两 组 ， 
区 别 在 于 是 否 应 用 了 粗 体 (bold) 属性 (1), 这 个 属 : 性 使 得 色彩 分 为 深 色 和 
浅 色 。 
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表 13-2 设置 文本 颜色 的 转 义 序列 


字符 序列 文本 颜色 
\033[0;30m 黑色 
\033[0;31m 红色 
\033[0;32m 绿色 
\033[0;33m 棕色 
\033[0;34m 蓝 色 
\033[0;35m 紫色 
\033[0;36m 青色 
\033[0;37m 淡 灰 色 
\033[1;30m 深 灰 色 
\033[1;31m 淡 红色 
\033[1;32m 淡 绿 色 
\033[1;33m 黄色 
\033[1;34m 淡 蓝 色 
\033[1;35m 淡 紫 色 
\033[1;36m 淡 青色 
\033[1;37m 白色 


现在 让 我 们 尝试 创造 红色 的 提示 符 ( 本 书 中 表现 为 灰色 )。 我 们 将 相应 的 转 
义 代码 插入 提示 符 的 开端 。 


<me@linuxbox ~>$ PS1="\[\033[0;31tm\]<\u@\h \W>\$ * 
<me@linuxbox ~>$ 


事实 证 明 操作 可 行 ， 但 是 此 时 用 户 输 入 的 所 有 文字 也 变 成 红色 了 。 要 修复 
这 个 问题 ， 可 以 在 提示 符 的 末尾 插入 另 一 条 转 义 码 ， 以 通知 终端 仿真 器 恢复 到 
原来 的 颜色 。 


<meelinuxbox ->$ PS1="\[\033[0;31m\]<\u@\h \W>\$\[\033[Om\] 。 
<meelinuxbox ~>$ 


这 样 就 好 多 了 。 
使 用 表 13-3 中 的 代码 可 以 设置 文本 的 背景 颜色 ， 背 景 颜色 不 支持 粗 体 属 性 。 
表 13-3 设置 背景 颜色 的 转 义 序列 


字符 序列 背景 颜色 


\033[0;40m 黑色 
\033[0;41m 红色 
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续 表 

字符 序列 背景 颜色 

\033[0;42m 绿色 

\033[0;43m 棕色 

\033[0;44m 蓝 色 

\033[0;45m 紫色 

\033[0;46m 青色 

\033[0;47m 淡 灰色 


通过 为 第 一 个 转 义 代码 做 一 些 修改 ， 就 可 以 创建 带 有 红色 背景 的 提示 符 。 


注意 文本 除了 正常 (0) 和 粗 体 (1 ) 属性 外 ， 还 可 以 设置 为 下 划 线 (4)、 闪 烁 (5) 
和 斜体 (7)。 为 了 维持 好 的 品味 ， 许 多 终端 仿真 器 拒绝 使 用 闪烁 属性 。 


13.4 移动 光标 


转 义 代码 也 可 以 用 来 定位 光标 。 比 如 在 提示 符 出 现 的 时 候 ， 这 些 转 义 代 
码 通常 用 来 在 屏幕 的 不 同位 置 〈 比 如 屏幕 上 方 的 一 角 ) 显示 一 个 时 钟 或 其 他 
信息 。 表 13-4 所 示 为 可 以 定位 光标 的 转 义 代码 。 


表 13-4 光标 移动 转 义 序列 


转 义 码 动作 

\033[l;cH 将 光标 移动 至 1 行列 

\033[nA 将 光标 向 上 移动 n 行 

\033[nB 将 光标 向 下 移动 n 行 

\033[nC 将 光标 向 前 移动 n 个 字符 

\033[nD 将 光标 向 后 移动 n 个 字符 

\033[27 清空 屏幕 并 将 光标 移动 至 左上 角 【〈 第 0 行 第 0 列 ) 
\033[K 清空 当前 光标 位 置 到 行 末 的 内 容 


\033[s 
\033[u 


存储 当前 光标 位 置 
恢复 之 前 存储 的 光标 位 置 


通过 使 用 这 些 代码 ,用 户 可 以 构建 这 样 的 一 条 提示 符 。 每 当 提 示 符 出 现时 ， 


屏幕 的 上 方 会 绘制 出 一 个 红色 的 横 条 ， 横 条 中 有 用 黄色 文本 显示 的 时 间 。 用 于 


第 13 章 ”定制 提示 符 ”141 


提示 符 的 编码 就 是 一 个 看 起 来 很 可 怕 的 字符 串 : 
PS1="\1\033{s\033[0;5OH\03310;41m\033[K\033[1;33m\t\033[Om\033[u\]<\ue\h \W>\$ * 
表 13-5 分 析 了 这 个 字符 串 中 每 一 部 分 的 作用 。 
表 13-5 复杂 提示 符 的 分 解 , 


字符 序列 
\ 


\033[s 
\033[0;0H 
\033[0;41m 


\033[K 


\033[1;33m 
\033[0m 
\033[u 


y 
Au@\h \W>\$ 


保存 提示 符 


动作 


开始 一 个 非 打印 字符 序列 。 其 真正 目的 是 为 了 让 bash 正确 计算 可 见 提 示 符 的 长 
度 。 如 果 没 有 该 字符 ， 命 令 行 编辑 功能 无 法 正确 定位 光标 


存储 光标 位 置 。 在 屏幕 的 顶部 横 条 绘制 完成 并 显示 时 间 后 ， 读 取 并 使 光标 返回 
此 位 置 。 需 要 注意 的 是 ， 一 些 终端 仿真 器 不 支持 该 代码 


将 光标 移动 至 左上 角 ， 即 第 0 行 第 0 列 
将 背景 颜色 设置 为 红色 


将 光标 当前 位 置 〈 左 上 角 ) 到 行 末 的 内 容 清 空 。 因 为 现在 背景 颜色 已 经 是 红色 
了 ， 所 以 清空 后 的 行 就 是 红色 ， 也 就 绘制 出 了 红色 的 横 条 。 需 要 注意 的 是 ， 清 
空 行 的 内 容 并 不 会 改变 光标 的 位 置 ， 光 标 仍 处 于 屏幕 左上 和 角 


将 文本 颜色 设置 为 黄色 


显示 当前 时 间 。 尽 管 这 是 一 个 可 打印 的 元 素 ， 但 是 还 是 将 其 包含 在 提示 符 非 打 
印 部 分 中 ， 这 是 因为 bash 在 计算 可 见 提示 符 的 长 度 时 ， 不 应 当 将 其 计算 在 内 
关闭 颜色 。 对 文本 和 背景 均 有 效 

恢复 之 前 存储 的 光标 位 轩 

结束 非 打印 的 字符 序列 

提示 符 字符 申 


很 显然 ， 用 户 不 会 想 要 每 次 都 输入 这 样 一 长 串 代 码 ， 所 以 就 需要 将 提示 符 
存储 在 某 个 地 方 。 将 提示 符 添加 到 .bashrc 文件 中 是 一 个 一 劳 永 锡 的 解决 办 法 ， 
也 就 是 将 以 下 两 行 代 码 添加 到 文件 中 。 


PS1="\[\033[s\033[0;OH\033[0;41m\033[K\033[1;33m\t\033[0m\033[u\]<\ue@\h \W>\$ " 


export PS1 


13.6 ”本章 结尾 语 


无 论 你 信和 是 不 信 ， 还 有 很 多 事情 也 可 以 通过 提示 符 来 完成 ， 这 会 涉及 我 们 这 
里 没有 讲解 到 的 shell 函数 和 脚本 , 但 这 是 一 个 好 的 开始 。 因 为 默认 的 提示 符 通常 
己 经 能 让 用 户 满意 ， 所 以 并 不 是 每 个 人 都 会 想 要 对 提示 符 做 出 修改 。 但 是 对 于 那 
些 喜 欢 探索 改进 的 用 户 来 说 ，shell 提示 符 提 供 了 很 多 制造 琐碎 乐趣 的 机 会 。 


第 三 部 分 
遇见 任务 和 主要 工具 


第 人 4 


软件 包 管理 


如 果 用 户 经 常 访问 Linux 社区 ， 那 么 针对 众多 Linux 发 行 版 本 中 哪 一 版 是 最 
好 的 这 一 问题 ， 一 定 听 到 过 诸多 观点 。 通 常 ， 有 关 此 问题 的 讨论 都 显得 非常 无 
聊 ， 因 为 他 们 都 将 侧重 点 放 在 诸如 哪个 版 本 的 桌面 背景 最 漂亮 《有 些 人 居然 因 
为 Ubuntu 的 默认 配色 方案 而 不 选择 使 用 它 ) 以 及 其 他 鸡毛 菠 皮 的 小 事 上 。 


其 实 , 决定 Linux 发 行 版 本 质量 最 重要 的 因素 是 软件 包 系 统 和 支持 该 发 行 
版 本 社区 的 活力 。 进 一 步 接触 Linux， 我 们 就 会 发 现 Linux 软件 的 研究 现状 相当 
活跃 。 事 物 总 是 在 不 断 变化 ， 许 多 一 流 的 Linux 发 行 版 本 每 6 个 月 就 有 一 个 新 
版 本 问世 ， 而 且 许 多 个 人 程序 每 天 都 在 更 新 。 要 想 同步 这 些 日 新 月 异 的 软件 ， 
我 们 就 需要 好 的 工具 进行 软件 包 管理 。 


软件 包 管 理 是 一 种 在 系统 上 安装 、 维 护 软 件 的 方法 。 目 前 ， 很 多 人 通过 安 
装 Linux 经 销 商 发 布 的 软件 包 来 满足 他 们 所 有 的 软件 需求 。 这 与 早期 的 Linux 
形成 了 鲜明 的 对 比 。 因 为 在 Linux 早期 ， 想 要 安装 软件 必须 先 下 载 源 代码 ， 然 
后 对 其 进行 编译 。 这 并 不 是 说 编译 源 代码 不 好 ， 源 代码 公开 恰 是 Linux 吸引 人 
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的 一 大 亮点 。 编 译 源 代码 赋予 用 户 自 主 检查 、 提 升 系统 的 能 力 ， 只 是 使 用 预先 
编译 的 软件 包 会 更 快 、 更 容易 些 。 

本 章 会 介绍 一 些 用 于 Linux 软件 包 管理 的 命令 行 工具 。 虽 然 所 有 主流 的 
Linux 发 行 版 本 都 提供 了 强大 而 复杂 的 维持 系统 运行 的 图 形 化 界面 操作 程序 , 但 
学 习 命令 行程 序 同样 重要 ， 因 为 它 可 以 执行 许多 图 形 化 程序 很 难 其 至 无 法 完成 
的 任务 。 


14.1 软件 包 系统 


不 同 的 Linux 发 行 版 用 的 是 不 同 的 软件 包 系 统 ， 并 且 原 则 上 ， 适 用 于 一 种 
发 行 版 的 软件 包 与 其 他 版 本 是 不 兼容 的 。 多数 Linux 发 行 版 采用 的 不 外 平 两 种 
软件 包 技术 阵营 ， 即 Debian 的 .deb 技术 和 Red Hat 的 .rpm 技术。 当然 也 有 一 
些 特例 ,比如 Gentoo、Slackware 和 Foresight 等 , 但 多 数 版 本 采取 的 还 是 表 14-1 
中 所 列 的 两 个 基本 软件 包 系 统 。 


表 14-1 主流 软件 包 系统 类 
软件 包 系 统 发 行 版 本 ( 只 列举 了 部 分 ) 
Debian 类 (.deb 技术 ) Debian、Ubuntu、Xandros、Linspire 


Fedora、CentOS、Red Hat Enterprise Linux、openSUSE、 
Mandriva、PCLinuxOS 


Red Hat 类 《〈.rpm 技术 》 


14.2 软件 包 系 统 工作 方式 


在 非 开源 软件 产业 中 ， 给 系统 安装 一 个 新 应 用 ， 通 常 需 先 购买 “安装 光秀” 
之 类 的 安装 介质 ， 然 后 运行 安装 向 导 进行 安装 。 

Linux 并 不 是 这 样 。 事 实 上 ，Linux 系统 所 有 软件 均 可 在 网 上 找到 ， 并 且 多 
数 是 以 软件 包 文件 的 形式 由 发 行商 提供 ， 其 余 则 以 可 手动 安装 的 源 代码 形式 存 
在 。 本 书 第 23 章 将 会 简 述 如 何 通 过 编译 源 代码 安装 软件 。 


14.2.1 软件 包 文件 
包 文件 是 组 成 软件 包 系统 的 基本 软件 单元 ， 它 是 由 组 成 软件 包 的 文件 压缩 
而 成 的 文件 集 。 一 个 包 可 能 包含 大 量 的 程序 以 及 支持 这 些 程序 的 数据 文件 ， 包 
文件 既 包 含 了 安装 文件 ， 又 包含 了 有 关 包 自身 及 其 内 容 的 文本 说 明之 类 的 软件 包 
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元 数据 。 此 外 ， 许 多 软件 包 中 还 包含 了 安装 软件 包 前 后 执行 配置 任务 的 安装 脚本 。 


包 文 件 通常 由 软件 包 维 护 者 创建 ， 该 维护 者 通常 〈 并 不 总 是 ) 是 发 行商 的 职 
员 。 包 维护 者 从 上 游 供应 商 〔 一 般 是 程序 的 作者 〉 获 得 软件 源 代码 ， 然 后 进行 纺 
译 ， 并 创建 包 的 元 数据 及 其 他 必需 的 安装 脚本 。 通 常 ， 包 维护 者 会 在 初始 源 代码 
上 做 部 分 修改 ， 从 而 提高 该 软件 包 与 该 Linux 发 行 版 本 其 他 部 分 的 兼容 性 。 


14.2.2 库 


虽然 一 些 软件 项 目 选择 自己 包装 和 分 销 ， 但 如 今 多 数 软件 包 均 由 发 行商 或 
感 兴趣 的 第 三 方 创建 。Linux 用 户 可 以 从 其 所 使 用 的 Linux 版 本 的 中 心 库 中 获得 
软件 包 。 所 谓 的 中 心 库 ， 一 般 包 含 了 成 二 上 万 个 软件 包 ， 而 且 每 一 个 都 是 专门 
为 该 发 行 版 本 建立 和 维护 的 。 

在 软件 开发 生命 周期 的 不 同 阶段 ， 一 个 发 行 版 本 可 能 会 维护 多 个 不 同 仓库 。 
例如 ， 通 常会 有 一 个 测试 库 ， 该 库 里 面 存放 的 是 刚 创 建 的 、 用 于 调试 者 在 软件 
包 正 式 发 布 前 查找 漏洞 的 软件 包 。 另 外 ， 一 个 发 行 版 本 通常 还 会 有 一 个 开发 库 ， 
存放 的 是 下 一 个 公开 发 行 的 版 本 中 所 包含 的 开发 中 的 软件 包 。 

一 个 发 行 版 本 可 能 还 会 有 相关 的 第 三 方 库 ， 这 些 库 通常 提供 因 法 律 原因 ， 
如 专利 或 数字 版 权 管理 (DRM) 等 反 规 避 问 题 而 不 能 包括 在 发 行 版 本 中 的 软件 ， 
著名 实例 就 是 加 密 的 DVD 技术 支持 , 该 做 法 在 美国 不 合法 。 第 三 方 库 主要 用 在 
软件 专利 和 反 规 避 法 不 适用 的 国家 ， 这 些 库 通常 完全 独立 于 它们 所 支持 的 Linux 
版 本 , 用 户 必须 充分 了 解 后 手动 将 其 加 入 到 软件 包 文件 管理 系统 的 配置 文件 中 ， 
才能 使 用 它们 。 


14.2.3 ”依赖 关系 


几乎 没有 任何 一 个 程序 是 独立 的 。 与 之 相反 ， 程 序 之 间 相 互 依赖 彼此 完成 
既定 工作 。 一 些 共 有 的 操作 ， 比 如 输入 /输出 操作 ， 就 是 由 多 个 程序 共享 的 例 程 
执行 。 这 些 例 程 存储 在 共享 库 里 面 ， 共 享 库 里 面 的 文件 为 多 个 程序 提供 必要 的 
服务 。 如 果 一 个 软件 包 需 要 共享 库 之 类 的 共享 资源 ， 说 明 其 具有 依赖 性 。 现 代 
软件 包 管理 系统 都 提供 依赖 性 解决 策略 ， 从 而 确保 用 户 安装 了 软件 包 的 同时 也 
安装 了 其 所 有 的 依赖 关系 。 


14.2.4 ”高 级 和 低级 软件 包工 具 
软件 包 管 理 系统 通常 包含 两 类 工具 一 一 执行 如 安装 、 删 除 软件 包 文件 等 任 
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务 的 低级 工具 和 进行 元 数据 搜索 及 提供 依赖 性 解决 的 高 级 工具 。 本 章 将 要 介绍 
Debian 类 型 的 系统 (如 Ubuntu 等 类 似 系 统 ) 所 提供 的 软件 包工 具 和 最 近 的 
Red-Hat 系列 产品 使 用 的 工具 。 尽 管 所 有 Red-Hat 系列 版 本 都 使 用 相同 的 低级 工 
具 (rpm), 但 使 用 的 高 级 工具 却 不 尽 不 同 。 下 面 我 们 将 讨论 高 级 软件 包工 具 yum 
程序 , 它 为 高 级 Fedora、Red Hat Enterprise Linux ( 红 帽 企业 版 Linux) 和 CentOS 
等 系统 所 用 ， 而 其 他 Red Hat 系列 的 发 行 版 本 也 提供 功能 与 之 相 媲美 的 高 级 工具 ， 


具体 见 表 14-2。 
表 14-2 软件 包 系 统 工具 
发 行 版 本 低级 工具 高 级 工具 
Debian 类 dpkg apt-get、aptitude 
Fedora、 Red Hat Enterprise Linux、 CentOS mpm yum 


14.3 ”常见 软件 包 管理 任务 
命令 行 软件 包 管理 工具 可 以 完成 许多 操作 ， 下 面 我 们 介绍 一 些 较 常见 的 。 
有 一 点 要 说 明 ， 低 级 工具 也 支持 软件 包 文件 的 创建 ， 但 不 在 本 书 的 讨论 范围 。 


在 下 面 的 讨论 中 ,单词 package_name 指 软件 包 的 实际 名 称 , 而 package_file 
则 是 指 包含 该 软件 包 的 文件 名 。 


14.3.1 在 库 里 面 查 找 软件 包 
通过 使 用 高 级 工具 来 搜索 库 元 数据 时 ， 我 们 可 以 根据 包 文 件 名 或 其 描述 来 查 


找 该 包 。 
表 14-3 包 搜 索 命令 
系统 类 型 命令 
Debian 系统 apt-get update 
apt-cache search search_string 
Red Hat 系统 yum search search_string 


例如 ， 在 Red Hat 系统 的 yum 库 中 搜索 emac 文本 编辑 器 的 代码 如 下 。 


yum search emacs 


14.3.2 ”安装 库 中 的 软件 包 
高 级 工具 允许 从 库 中 下 载 、 安 装 软件 包 ， 同 时 安装 所 有 的 依赖 包 《〈 见 表 
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14-4)。 
表 14-4 软件 包 安 装 命令 
系统 类 型 命令 行 
; apt-get update 
Debian 系统 apt-get install package_name 
Red Hat 系统 yum instali package_name 


例如 ， 在 Debian 系统 上 安装 apt 元 数据 库 中 的 emac 文本 编辑 器 的 代码 如 下 。 


apt-get update; apt-get install emacs 


14.3.3 ”安装 软件 包 文件 中 的 软件 包 


如 果 软 件 包 文件 并 不 是 从 库 源 中 下 载 的， 那么 我 们 就 可 用 低级 工具 直接 安 
装 〈 但 并 不 安装 依赖 性 关系 )， 具 体 见 表 14-5。 


表 14-5 低级 软件 包 安 装 命 令 


系统 类 型 命令 
Debian 系统 dpkg --install package_file 
Red Hat 系统 rpm -i package_file 


例如 ， 当 emacs-22.1-7.fc7-i386.rpm 软件 包 文 件 从 非 库 资 源 网 站 下 载 时 ， 可 
采用 如 下 方式 安装 于 Red Hat 系统 中 。 


rpm -i emacs-22.1-7.fc7-i386.rpm 


注意 由 于 该 方法 采用 低级 rpm 工具 安装 , 所 以 并 不 会 解决 依赖 性 关系 ,一旦 rpm 
在 安装 过 程 中 发 现 缺少 依赖 包 ，rpm 就 会 跳出 错误 后 退出 。 


14.3.4 ”删除 软件 包 
印 载 软件 包 既 可 利用 高 级 工具 也 可 用 低级 工具 ， 高 级 工具 的 相关 命令 见 


表 14-6。 
表 14-6 软件 包 移 除 命令 
系统 类 型 命令 
Debian 系统 apt-get remove package_name 


Red Hat 系统 yum erase package_name 
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例如 ， 从 Debian 系统 中 外 载 emacs 软件 包 的 代码 如 下 。 


apt-get remove emacs 


14.3.5 ”更 新 库 中 的 软件 包 


最 常见 的 软件 包 管 理 任务 是 保持 系统 安装 最 新 的 软件 包 。 高 级 工具 仅 需要 
一 步 便 可 完成 此 重要 任务 〈 见 表 14-7)。 


表 14-7 软件 包 更 新 命令 


系统 类 型 命令 
Debian 系统 apt-get update; apt-get upgrade 
Red Hat 系统 yum update 


例如 ， 更 新 所 有 已 安装 于 Debian 系统 中 的 可 更 新 软件 包 的 代码 如 下 。 


apt-get update; apt-get upgrade 


14.3.6 ”更 新 软件 包 文 件 中 的 软件 包 
如 果 软 件 包 的 更 新 版 本 已 从 非 库 源 中 下 载 ， 那 么 我 就 可 以 用 表 14-8 所 列 的 


命令 进行 安装 更 新 从 而 取代 原版 本 。 
表 14-8 低级 软件 包 更 新 命令 
系统 类 型 命令 
Debian 系统 dpkg --install package_file 
Red Hat 系统 rpm -U package_file 


例如 , 将 Red Hat 系统 上 已 安装 好 的 emac 程序 更 新 为 emacs-22.1-7.fc7-i386.rpm 
软件 包 文 件 中 的 版 本 的 代码 如 下 。 


rpm -U emacs-22.1-7.fc7-i386.rpm 


注意 与 pm 命令 不 同 ，dpkg 命令 在 更 新 软件 包 时 并 没有 指定 的 参数 选项 ， 只 有 
在 安装 软件 包 时 才 有 。 


14.3.7” 列 出 已 安装 的 软件 包 列 表 
表 14-9 中 所 列 出 的 命令 用 于 显示 系统 上 所 有 已 安装 的 软件 包 列 表 。 
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表 14-9 软件 包 列 表 命 令 


系统 类 型 命令 
Debian 系统 dpkg --list 
Red Hat 系统 rpm -qa 


14.3.8 ”判断 软件 包 是 否 安装 


表 14-10 中 所 列 的 为 低级 工具 用 于 判断 系统 是 否 已 安装 某 个 软件 的 命令 。 
表 14-10 软件 包 状态 命令 


系统 类 型 作 令 、 
Debian 系统 dpkg --status package_name 
Red Hat 系统 rpm -q package_name 


例如 ， 判 断 emae 程序 包 在 Debian 系统 中 是 否 已 安装 的 代码 如 下 。 


dpkg --status emacs 


14.3.9 显示 已 安装 软件 包 的 相关 信息 
在 已 知己 安装 的 软件 包 的 名 称 的 情况 下 ， 便 可 以 用 表 14-11 中 的 命令 显示 


该 软件 包 的 描述 信息 。 
表 14-11 软件 包 信息 查看 命令 
系统 类 型 命令 
Debian 系统 apt-cache show package_name 
Red Hat 系统 yum info package_name 


例如 ， 查 看 Debian 系统 上 emac 软件 包 的 描述 信息 的 代码 如 下 。 


apt-cache Show emacs 


14.3.10 ”查看 某 具体 文件 由 哪个 软件 包 安 装 得 到 
表 14-12 中 的 命令 判断 某 个 特定 的 文件 是 由 哪个 软件 包 负 责 安装 的 。 
表 14-12 查询 文件 所 属 命令 
系统 类 型 命令 


Debian 系统 dpkg --search file_name 
Red Hat 系统 rpm -qf file_name 
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例如 ， 查 看 Red Hat 系统 中 哪个 软件 包 安 装 了 /usr/bin/vim 目录 下 的 文件 的 
代码 如 下 。 


rpm -qf /usr/bin/vim 


14.4 _ 本章 结尾 语 


在 后 面 的 章节 ， 我 们 将 会 讨论 许多 应 用 非常 广泛 的 程序 。 尽 管 其 中 多 数 程 
序 由 系统 默认 安装 ， 但 有 时 仍然 需要 我 们 安装 一 些 额 外 的 软件 包 。 就 本 章 中 介 
绍 的 软件 包 管理 方面 的 知识 ， 我 们 足以 安装 和 管理 以 后 所 需要 的 程序 。 


Linux 软件 安装 的 神秘 之 处 

学 习 使 用 Linux 平台 的 人 有 了 时 会 觉得 在 该 平台 上 安装 软件 很 困难 ， 而 且 
不 同 的 发 行 版 本 所 用 的 多 样 化 软件 包 策略 对 使 用 者 来 说 也 是 一 大 障碍 。 确 实 ， 

这 是 屏障 ,但 也 只 是 对 于 那些 希望 发 布 私 有 软件 二 进 制版 本 的 专 有 软件 

厂商 而 言 。 

Linux 软件 基于 开放 源 代码 的 思想 上 。 当 程序 的 开发 者 发 布 了 菜 产品 的 源 
代码 后 ， 很 有 可 能 会 有 一 个 与 之 相关 的 人 打包 该 产品 ， 并 将 其 添加 到 该 发 
行 版 的 库 中 . 这 种 方法 可 以 确保 该 产品 能 够 与 发 行 版 本 保持 很 好 的 兼容 性 并 
且 给 使 用 者 提供 一 个 一 站 式 的 软件 购买 平台 ， 而 不 需要 搜索 每 个 产品 的 网 
站 主页 。 

除了 那些 已 经 加 入 到 Linux 内 核 的 、 不 再 是 库 中 独立 个 体 的 设备 驱动 ， 
其 他 设备 驱动 的 处 理 方式 都 差不多 。 总 体 而 言 ，Linux 世界 中 并 没有 “驱动 光 
盘 ” 这 一 类 东西 。Linux 系统 很 干脆 ， 其 内 核 要 么 支持 该 设备 要 么 不 支持 。 事 
实 上 ，Linux 内 核 要 比 Windows 内 核 支 持 的 设备 多 很 多 。 当 然 ， 如 果 你 所 需 
要 的 特定 设备 不 被 Linux 支持 ， 那 即便 比 Windows 多 也 无 济 于 事 。 如 果 发 生 这 
样 的 情况 ， 便 需要 寻找 原因 。 设 备 不 被 支持 一 般 是 由 以 下 三 个 原因 造成 的 。 

e 设备 太 新 。 由 于 许多 硬件 开发 商 并 不 积极 支持 Linux 的 开发 ， 这 就 需要 
Linux 社区 的 成 员 花 时 间 编 写 该 硬件 设备 的 驱动 代码 。 

。 设备 太 稀 少 。 并 不 是 所 有 的 发 行 版 本 都 包括 了 所 有 的 设备 驱动 。 每 一 个 发 
行 版 本 都 建立 了 自己 的 内 核 ， 并 且 由 于 内 核 本 身 是 可 配置 的 ( 正 是 由 于 内 
核 可 配置 ， 所 以 Linux 才能 在 运行 在 从 手表 到 大 型 主机 的 所 有 设备 上 )， 
所 以 发 行 版 本 可 能 就 会 忽略 了 某 个 特定 的 设备 . 通过 寻找 以 及 下 载 该 设备 
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的 源 代码 , 你 完全 可 以 自己 编译 、 安 装 该 驱动 . 这 个 过 程 虽 不 是 那么 困难 ， 
但 却 有 点 复杂 。 本 书 第 23 章 将 会 讨论 如 何 编译 软件 。 

硬件 供应 商 隐藏 了 某 些 东西 . 某 些 硬件 既 没 有 发 布 Linux 驱动 的 源 代码 ,也 
没有 提供 给 他 人 编写 驱动 代码 的 技术 文档 ， 也 就 是 说 该 硬件 供应 商 打 算 保 
密 此 硬件 编程 接口 。 一 般 来 说 ， 使 用 者 都 不 希望 自己 的 计算 机 里 有 保密 设 
备 ， 所 以 建议 移 除 这 些 硬 件 ， 并 将 其 与 其 他 无 用 文件 一 并 放 入 垃圾 箱 。 


% 1D 


存储 介质 


前 面 的 章节 我 们 主要 讨论 了 文件 级 别 的 数据 处 理 ， 本 章 我 们 将 会 讨论 设备 
级 别 的 数据 处 理 。 对 于 诸如 硬盘 之 类 的 物理 存储 器 、 网 络 存储 器 以 及 像 RAID 
《独立 元 余 磁 盘 阵 列 ) 和 LYM (逻辑 卷 管理 ) 之 类 的 虚拟 存储 器 ，Linux 都 具有 
惊人 的 处 理 能 力 。 

然而 ， 本 书 并 不 是 以 介绍 系统 管理 为 主 ， 所 以 在 此 我 们 并 不 打算 深入 探讨 这 个 
主题 ， 我 们 只 会 简单 介绍 其 基本 概念 以 及 用 于 管理 存储 设备 的 一 些 重要 命令 。 

为 了 能 够 更 好 地 练习 本 章 中 的 例子 ， 我 们 需要 使 用 一 个 USB 闪存 、 一 张 
CD-RW 光盘 《用 于 可 进行 光盘 刻录 的 系统 ) 以 及 一 张 软盘 〈 如 果 系 统 就 是 这 么 
配置 )。 

本 章 将 会 介绍 如 下 命令 。 

。 mount: 挂 载 文 件 系统 。 
e unmount: 印 载 文件 系统 。 
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。 fdisk: 硬盘 分 区 命令 。 

。 fsck: 检查 修复 文件 系统 。 

。 fdformat: 格式 化 软盘 。 

。 mkf: 创建 文件 系统 。 

。 dd: 向 设备 直接 写 入 面向 块 数据 。 

。 genisoimage (mkisofs): 创建 一 个 ISO 9600 映像 文件 。 
。 wodim (cdrecord): 向 光 存 储 介质 写 入 数据 。 

。 md5sum: 计算 MD5 校 验 码 。 


15.1 “ 挂 载 、 伸 载 存储 设备 


Linux 图 形 界面 操作 最 近 所 取得 的 进展 已 使 得 图 形 界 面 操作 用 户 能 非常 容 
易 地 管理 存储 设备 。 多 数 情况 下 ， 设 备 只 要 连接 上 系统 就 能 运作 。 但 是 ， 过 去 
(差不多 在 2004 年 )， 这 必须 通过 手动 操作 。 由 于 像 服 务 器 这 类 的 非 图 形 界面 操 
作 系 统 通常 都 有 一 些 极致 的 存储 需求 和 复杂 的 配置 要 求 ， 所 以 在 这 类 系统 中 管 
理 存 储 设备 很 大 程度 上 还 是 靠 手动 操作 。 


管理 存储 设备 首先 要 做 的 就 是 将 该 设备 添加 到 文件 系统 树 中 ， 从 而 允许 操 
作 系 统 可 以 操作 该 设备 ， 这 个 过 程 称 之 为 挂 载 。 回 忆 一 下 第 2 章 所 讲 的 知识 ， 
类 UNIX 操作 系统 ， 与 Linux 相似 ， 都 只 有 一 个 文件 系统 树 ， 设 备 则 都 连接 到 
树 的 不 同 点 上 。 这 就 与 其 他 操作 系统 诸如 MS-DOS、Windows 等 不 同 ， 它 们 对 
于 每 个 设备 都 有 独立 的 树 〈 如 CN\、D: 等 )。 


/etc/fstab 文件 内 容 列 出 了 系统 启动 时 挂 载 的 设备 〈 通 常 是 硬盘 分 区 )。 下 例 
所 示 的 是 某 个 Fedora 7 系统 上 /ete/fstab 文件 的 内 容 。 


LABEL=/12 / ext3 defaults 11 
LABEL= /home /home ext3 defaults 12 
LABEL= /boot /boot ext3 defaults 12 
tmpfs /dev/shm tmpfs defaults 0 0 
devpts /devipts devpts gid=5,mode=620 0 0 
sysfs lsys sysfs defaults 0 0 
proc /proc proc defaults 0 0 
LABEL=SWAP - sda3 swap swap defaults 0 0 


此 文件 中 列 出 的 文件 系统 多 数 是 虚拟 的 ， 不 适用 于 当前 的 讨论 。 其 前 三 项 
内 容 ， 才 是 我 们 所 要 关注 的 重点 内 容 。 
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LABEL=/12 / ext3 defaults 1 1 
LABEL=/home /home ext3 defaults 12 
LABEL=/boot /boot ext3 defaults 12 
这 三 行内 容 其 实 指 的 是 硬盘 分 区 ， 文 件 中 的 每 一 行 含 6 个 字段 ， 如 表 15-1 
所 示 。 3 
表 15-1 /etc/fstab 文件 6 个 参数 含义 
字段 内 容 描述 


通常 ， 该 字段 表示 的 是 与 物理 设备 相关 的 设备 文件 的 真实 名 称 ， 比 如 
dev/hdal 就 代表 第 一 个 IDE 通道 上 的 主 设 备 的 第 一 块 分 区 。 但 是 如 今 
的 计算 机 都 有 很 多 可 热 拔 播 的 设备 〈 像 USB 驱动 器 )， 所 以 许多 较 新 
1 设备 的 Linux 发 行 版 用 文本 标签 来 关联 设备 。 当 设备 与 系统 连接 后 ， 该 标 
签 格式 化 后 就 会 加 到 存储 介质 中 就 会 被 操作 系统 识别 。 通 过 这 样 
的 方式 ， 不 管 实际 的 物理 设备 被 分 配 到 哪个 设备 文件 ， 它 仍然 能 被 正 


确 识别 
2 挂 裁 节 点 设备 附加 到 文件 系统 树 上 的 目录 

Linux 能 够 挂 载 许多 文件 系统 类 型 ， 最 常见 的 原始 文件 系统 是 ext3， 
3 文件 系统 类 型 但 也 支持 许多 其 他 系统 如 FAT16 (msdos)、FAT32 (vfat)、NTFS (ntfs》、 


CD-ROM (iso9660) 等 
文件 系统 挂 载 时 可 以 使 用 许多 选项 参数 ， 比 如 ， 可 以 设置 文件 系统 以 


4 选项 只 读 的 方式 挂 载 或 是 阻止 任何 程序 修改 它们 (对 于 可 移动 设备 是 一 个 
很 有 用 的 维护 安全 性 的 方法 )。 
此 数值 被 dump 命令 用 来 决定 是 否 对 该 文件 系统 进行 备份 以 及 多 久 备 
5 频率 份 一 次 
6 优先 级 此 数值 被 fsck 命令 用 来 决定 在 启动 时 需要 被 扫描 的 文件 系统 的 顺序 


15.1.1 查看 已 挂 载 的 文件 系统 列表 


mount 命令 用 于 文件 系统 挂 载 。 不 带 任何 参数 输入 该 命令 将 会 调 出 目前 已 
经 挂 载 的 文件 系统 列表 : 


[me@linuxbox ~]$ mount 

/dev/sda2 on / type ext3 (rw) 

proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /dev/pts type devpts (rw,gid=5,mode=620) 

/dev/sda5 on /home type ext3 (rw) 

/dev/sdal1 on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on /proc/sys/fs/binfmt misc type binfmt _ misc (rw) 
sunrpc on /var/lib/nfs/rpc pipefs type rpc_pipefs (rw) 
fusectl on /sys/fs/fuse/connections type fusect1 {rw) 
/dev/sdd1 on /media/disk type vfat (rw,nosuid,nodev,noatime, 
uhelper=hal,uid=500,utf8,shortname=lower) 

twin4:/musicbox on /misc/musicbox type nfs4 (rw,addr=192.168.1.4) 


列表 的 格式 是 ; devyice on mont point type filesystem_type (options)。 例 如 ， 
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上 例 中 的 第 一 行 表 示 dev/sda2 设备 挂 载 在 根 目录 下 ， 可 读 写 (后 面 的 参数 选项 
是 rw)， 属 于 ext3 类 型 。 然 而 ， 可 以 看 到 该 列表 的 末尾 有 两 个 有 趣 的 条 目 ， 倒 
数 第 二 个 条 目 表示 /mediay/disk 目录 下 挂 载 了 读 卡 器 中 2GB 的 SD 记忆 卡 ， 最 后 
一 个 条 目 表 示 /misc/musicbox 目录 下 挂 载 了 一 个 网 络 驱 动 。 


以 CD-ROM 为 例 ， 在 我 们 插入 CD-ROM 前 ， 首 先 查 看 一 下 系统 信息 : 


[meelinuxbox ~]$ mount 
/dev/mapper/VolGroup00-LogVol00 on / type ext3 (rw) 
proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /dev/pts type devpts (rw,gid=5,mode=620) 
/devihdal on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on jproc/sys/fs/binfmt misc type binfmt misc (rw) 
sunrpc on /var/lib/nfs/rpc pipefs type rpc_pipefs (rw) 


该 列表 来 自 于 一 个 使 用 LVM 机 制 创 建 其 根 文件 系统 的 CentOS5 系统 。 与 
许多 现代 Linux 发 行 版 一 样 ， 此 系统 在 CD-ROM 插入 后 会 自动 进行 挂 载 。 光 盘 
插入 后 ， 输 入 mount 命令 ， 便 会 显示 如 下 系统 信息 : 


[me@linuxbox ~]$ mount 

/dev/mapper /VolGroup00-LogVol00 on / type ext3 (rw) 

proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /devipts type devpts (rw,gid=5 'mode=620) 

/dev/hda1 on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on /proc/sys/fs/binfmt misc type binfmt misc (rw) 

sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw) 

/dev/hdc on /media/live-1.0.10-8 type iso9660 (ro,noexec,nosuid,nodev,uid=500) 


与 之 前 的 信息 列表 相 比 ， 本 列表 只 是 在 末尾 处 多 了 一 个 额外 的 条 目 ， 该 条 目 表 
示 CD-ROM (本 系统 上 的 设备 名 是 /dewhdc) 已 经 挂 载 在 了 /mediaylive-1.0.10-8 目录 
下 并 且 是 iso9660 类 型 。 此 处 只 需要 关注 设备 名 ， 读 者 进行 实验 时 ， 设 备 名 很 有 
可 能 就 不 一 样 。 


警告 下 面 的 例子 中 ， 要 时 刻 注意 自己 使 用 的 系统 上 显示 的 实际 设备 名 ， 千 万 不 
要 直接 用 本 文中 使 用 的 名 字 。 


同时 ， 要 注意 音频 CD 与 CD-ROM 是 不 一 样 的 。 音频 CD 并 不 包含 文件 系统 ， 
所 以 通常 意义 上 讲 ， 音 频 CD 不 能 被 挂 载 。 


获取 CD-ROM 的 设备 名 之 后 ， 便 可 以 卸载 该 设备 ， 然 后 将 其 挂 载 在 文件 
系统 树 的 另外 一 个 节点 上 。 进 行 此 操作 ， 必 须 首 先 获得 超级 用 户 〈 使 用 适用 于 自 
己 系统 的 命令 切换 为 超级 用 户 ) 权限 ， 再 使 用 umount (注意 拼写 ) 命令 卸载 光盘 。 
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[me@linuxbox ~]$ su - 
Password: 
[rootelinuxbox ~]# umount /dev/hdc 


接 下 来 ， 我 们 为 光盘 创建 一 个 新 的 挂 载 节点 。 挂 载 节点 仅仅 是 文件 系统 上 
的 某 个 目录 ， 并 没有 什么 特别 之 处 ， 甚 至 都 不 需要 是 空 目 录 ， 尽 管 如 果 在 非 空 
目录 上 挂 载 设备 ， 该 目录 下 原 有 内 容 将 不 可 见 直 到 此 设备 被 卸载 。 作 为 演示 ， 我 
们 先 创建 一 个 新 目录 : 


【rootelinuxbox ~]# mkdir /mnt/cdrom 

终于 ， CD 光盘 挂 载 在 了 新 的 节点 上 ， 使 用 -t 选项 指定 文件 系统 类 型 : 
[rootelinuxbox -]# mount -t 1s09660 /dev/hde /mnt/cdrom 

之 后 ， 便 可 以 通过 新 建 的 挂 载 节点 访问 CD 光盘 的 内 容 : 


[root@linuxbox ~]# cd /mnt/cdrom 
[root@linuxbox cdrom]# 1s 


请 注意 ， 如 果 此 时 试图 卸载 CD 光盘 就 会 出 现下 面 的 问题 : 


[root@linuxbox cdrom]# unount /dev/hdc 
umount: /mnt/cdrom: device is busy 


为 什么 会 出 现 这 个 问题 ? 因为 设备 正在 被 某 人 或 是 某 程序 使 用 时 是 不 能 被 
印 载 的 。 本 例 中 的 工作 目录 正好 是 CD 光盘 的 挂 载 节点 ， 所 以 导致 了 “设备 繁忙 ” 
的 错误 警告 。 只 要 我 们 将 工作 目录 改 到 挂 载 节点 以 外 的 地 方 就 能 轻松 解决 : 


[root@linuxbox cdrom]# cd 
[root@linuxbox ~]# umount /dev/hdc 


如 此 该 设备 便 卸 载 成 功 了 。 


为 什么 卸载 如 此 重要 

free 命令 会 输出 关于 存储 器 使 用 情况 的 一 些 数据 ，buffer (缓存 ) 就 包括 
在 其 中 。 计 算 机 系统 是 以 运行 得 尽 可 能 快 为 原则 设计 的 ， 阻 碍 计算 机 运行 速 
度 的 一 大 因素 就 是 低速 设备 。 打 印 机 则 是 一 个 典型 的 低速 设备 ， 从 计算 机 的 
角度 来 看 ， 即 便 是 最 快 的 打印 机 也 已 经 是 极其 慢 了 。 如 果 计 算 机 必须 停 下 来 
等 待 打 印 机 完成 一 页 的 打印 ， 那 么 计算 机 肯定 会 运行 得 相当 慢 。 计算 机 出 现 
早期 也 就 是 还 没有 能 够 进行 多 任务 处 理 的 时 期 ， 这 的 确 是 个 问题 。 每 次 打 
印 电子 表格 或 是 文本 文档 时 计算 机 就 必须 停止 工作 。 计 算 机 以 打印 机 能 够 接 
受 的 最 快速 度 向 打印 机 传送 数据 ， 但 是 由 于 打印 的 速度 很 慢 所 以 数据 传送 也 
很 慢 。 打 印 缓冲 区 的 问世 ， 解 决 了 数据 传输 慢 的 问题 。 打 印 缓冲 区 是 存在 于 
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15.1.2 


计算 机 与 打印 机 之 间 的 RAM 存储 器 设备 ， 有 了 打印 缓冲 区 ， 计 算 机 就 可 以 将 
准备 发 送 给 打印 机 的 数据 先 发 送 给 缓冲 区 ， 这 个 过 程 可 以 进行 得 很 快 因为 
RAM 的 存储 速度 很 块 ， 从 而 计算 机 能 尽快 返回 去 处 理 其 他 进程 而 不 是 停 下 来 
等 待 。 与 此 同时 ， 打 印 缓冲 区 再 慢 慢 地 以 打印 机 能 接受 的 速度 从 缓冲 区 存储 
中 向 打印 机 传送 数据 。 

为 了 提升 计算 机 的 运行 速度 ， 缓 冲 区 思想 在 计算 机 中 得 到 了 广泛 运用 。 
从 /向 较 慢 设备 偶然 性 的 读 / 写 数据 不 再 会 妨碍 系统 的 运行 速度 , 操作 系统 会 将 
那些 已 经 从 存储 设备 读 取 或 是 准备 向 存储 设备 写 入 的 数据 一 直 储 存在 内 存 
中 ， 直 到 这 些 数据 确实 需要 与 较 慢 设备 发 生 交互 。 以 linux 系统 为 例 ， 它 似乎 
总 是 试图 填 满 其 内 存 ， 但 这 并 不 意味 着 Linux 会 用 尽 所 有 的 存储 器 ， 只 能 说 
Linux 正 充分 利用 其 可 利用 的 一 切 内存 进 行 尽 可 能 多 的 缓存 操作 。 

由 于 缓冲 区 的 存在 ， 向 物理 设备 的 写 入 操作 被 推迟 到 了 未 来 某 个 时 间 ， 
所 以 能 快速 向 存储 设备 写 入 数据 。 与 此 同时 ， 准 备 写 入 设备 的 数据 不 断 向 缓 
冲 区 堆积 ， 而 操作 系统 则 不 时 地 将 这 些 数据 写 入 物理 设备 。 

纯 载 设备 能 确保 缓存 中 的 所 有 剩余 数据 全 部 写 入 设备 ， 从 而 设备 能 被 安 
全 移 除 。 如果 设 备 事先 没有 和 纯 载 就 被 移 除 ， 那 么 缓存 中 就 可 能 仍 有 剩余 数据 . 
有 些 情况 下 ， 这 些 未 传输 完 的 数据 可 能 包含 重要 的 目录 更 新 信息 ， 而 这 些 信 
息 会 导致 文件 系统 损坏 ， 这 时 情况 就 粮 透 了 . 


确定 设备 名 称 


对 于 现在 的 系统 ， 有 时 设备 名 称 的 确定 比较 困难 。 但 是 在 过 去 ， 由 于 设备 
总 是 在 一 个 地 方 固 定 不 动 ， 所 以 确定 设备 名 并 不 是 那么 困难 。 类 UNIX 系统 则 
偏爱 这 种 方式 ，UNIX 开发 初期 ， 更 改 磁盘 驱动 就 像 用 铲 车 将 洗衣 机 大 小 的 设 
备 从 机 房间 里 面 移 除 那 样 困难 。 近 些 年 ， 典 型 台式 机 的 硬件 配置 已 经 变 得 很 灵 
活 ， 而 Linux 也 通过 不 断 完 善 变 得 灵活 了 许多 。 

上 例 利用 了 现代 Linux 桌面 系统 的 一 种 能 力 一 一 自动 挂 载 设备 后 确定 设备 名 。 
但 是 如 果 操作 的 是 一 台 服 务 器 或 者 在 不 支持 这 样 的 自动 挂 载 操 作 的 情况 下 ， 
我 们 那 该 怎么 办 ? 

要 解决 上 述 问题 ， 让 我 们 首先 了 解 系统 是 如 何 命名 设备 的 。 查 看 /dev 目录 
《所 有 设备 所 在 的 目录 下 的 设备 信息 ， 我 们 会 发 现 有 海量 的 设备 : 


[me@linuxbox ~]$ ls /dev 
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ls 命令 输出 的 表单 内 容 揭 示 了 设备 命名 的 一 些 固定 模式 ， 表 15-2 列 出 了 部 分 : 


表 15-2 Linux 存储 设备 名 称 
模式 设备 


/dev/fd* 软盘 驱动 器 


较 旧 系统 上 的 IDE (或 PATA) 硬盘 。 典 型 的 主板 有 两 个 IDE 连接 点 或 通道 ， 并 
且 每 个 都 有 两 个 驱动 器 附着 点 。 线 缆 上 第 一 个 驱动 器 叫做 主 设备 ， 第 二 个 叫做 从 

jlevie 设备 。 设 备 命名 按照 如 下 规则 进行 ，/dev/hda 代表 第 一 个 通道 上 的 主 设备 ，/dev/hdb 
代表 第 一 个 通道 上 的 从 设备 ，/dev/hdc 代表 第 二 个 通道 上 的 主 设备 ， 以 此 类 推 ， 
而 末尾 的 数字 代表 设备 的 分 区 号 。 例 如 ， 当 /dev/hda 代表 整个 硬盘 时 ，/dev/hdal 
表示 该 硬盘 驱动 上 的 第 一 块 分 区 


/dew/lp* 打印 机 设备 
SCSI 硬盘 ， 在 最 近 的 Linux 系统 上 ， 内 核 把 所 有 的 类 硬盘 设备 (包括 PATA/SATA 
/dev/sd* 硬盘 、 闪 存 、USB 海量 存储 设备 比如 便携 式 音乐 播放 器 或 数码 相机 等 ) 都 当 作 
SCSI 硬盘 。 剩 下 的 命名 规则 与 上 面 所 讲 的 /dewhd* 的 命名 规则 类 似 
/dev/sr* 光驱 《CD/DY 播放 机 和 刻录 机 ) 


另外 ， 我 们 经 常 能 看 到 像 /dewcdrom、/dewdvd、/dewfloppy 这 样 的 符号 链 
接 ， 它 们 都 是 指向 实际 设备 文件 的 ， 使 用 符号 链接 只 是 为 了 使 用 方便 。 


如 果 读 者 使 用 的 系统 不 能 自动 挂 载 可 移动 设备 ， 那 么 可 以 用 下 面 介绍 的 方 
法 来 命名 插入 系统 的 可 移动 设备 。 首 先 ， 对 /var/log/messages 文件 进行 实时 查看 
《此 操作 可 能 需要 超级 用 户 权 利 ): 


[me@linuxbox ~]$ sudo tail -f /var/log/messages 


文件 的 最 后 儿 行 输出 显示 后 停止 该 程序 ， 接 着 插入 可 移动 设备 。 以 16MB 的 
闪存 为 例 ， 几 乎 在 插入 瞬间 ， 内 核 就 注意 并 且 检 测 到 了 此 设备 : 


Jul 23 10:07:53 linuxbox kernel: Usb 3-2: new Tull speed USB device using Uhci_h 

cd and address 2 

Jul 23 10:07:53 linuxbox kernel: usb 3-2: configuration #1 chosen from 1 choice 

Jul 23 10:07:53 linuxbox kernel: scsi3 : SCSI emulation for USB Mass Storage dev 

Jul 23 10:07:58 linuxbox kernel: scsi scan: INQUIRY result too short (5)}, using 

Jul 23 10:07:58 linuxbox kernel: scsi 3:0:0:0: Direct-Access Easy Disk 1.00 PQ: 
:2 


Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] 31263 512-byte hardware secto 
rs (16 MB) 


Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Write Protect is off 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Assuming drive cache: write 七 
hrough 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] 31263 512-byte hardware secto 
rs (16 MB) 

JuU1L 23 10:07:59 linyuxbox kernel: sd 3:0:0:0: [sdb] Write Protect is off 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Assuming drive cache: write t 


hrough 
Jul 23 10:07:59 linuxbox kernel: sdb: sdb1 
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Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: {sdb] Attached SCSI removable disk 
Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: Attached scsi generic sg3 type 0 


信息 显示 完成 ， 按 下 Ctrl-C 回 到 命令 提示 界面 。 查 看 输出 信息 ， 我 们 会 看 
到 很 多 地 方 重复 提 到 [sdb], 这 正好 与 SCSI 类 型 的 硬盘 设备 名 相 匹配 。 了 解 了 这 一 
点 ， 我 们 就 自然 会 额外 注意 下 面 的 两 行 信息 ; 


Jul 23 10:07:59 Linuxbox Kernel: sdb: sdb1 
Jul 23 10:07:59 Linuxbox kernel: sd 3:0:0:0: [sdb] Attached SCSI removable disk 


以 上 信息 告诉 我 们 该 设备 名 是 /dev/sdb, /dev/sdbl 指 的 是 此 设备 的 第 一 个 分 
区 。 正 如 大 家 所 看 到 的 ， 学 习 使 用 Linux 是 一 项 有 趣 的 发 现 工作 。 


tail -f /var/log/messages 命令 行 是 用 来 进行 实时 系统 监测 的 好 方法 。 


获得 设备 名 后 ， 我 们 便 可 以 挂 载 此 闪存 设备 : 


[me@linuxbox ~]$ sudo mkdir /mnt/flash 
[me@linuxbox ~]$ sudo mount /dev/sdbt /mnt/flash 
[me@linuxbox ~]$ df 


Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/sda2 15115452 5186944 9775164 35% / 
/dev/sda5 59631908 31777376 24776480 57% /home 
/dev/sdai 147764 17277 122858 13% /boot 
tmpfs 776808 0 776808 0% /dev/shm 
/dev/sdb1 15560 0 15560 0% /mnt/flash 


只 要 设备 一 直 与 计算 机 保持 连接 并 且 系统 没有 重启 ， 设 备 名 就 不 会 改变 。 


15.2 ”创建 新 的 文件 系统 


将 一 个 使 用 FAT32 文件 系统 的 闪存 驱动 器 重新 格式 化 为 Linux 本 地 文件 
系统 ， 需 要 两 个 步骤 : 第 一 ，( 可 选 ) 在 对 现 有 的 分 区 不 满意 的 情况 下 创建 一 个 
新 的 分 区 布局 ; 第 二 ， 在 驱动 器 上 创建 一 个 新 的 空 文件 系统 。 


直面 是 一 个 格式 化 闪存 驱动 器 的 例子 。 由 于 在 使 用 过 程 中 闪存 中 的 所 有 内 


容 都 会 被 擦 除 ， 所 以 最 好 准备 一 个 不 合 任 何 重要 文件 的 驱动 器 。 另外， 要 绝对 
确保 指定 的 是 自己 系统 上 显示 的 实际 设备 名 而 不 是 直接 用 本 文中 使 用 的 设备 
名 ， 否 则 可 能 会 格式 化 错误 的 驱动 器 ! 


15.2.1 用 fdisk 命令 进行 磁盘 分 区 


fdisk 命令 实现 用 户 与 磁盘 设备 〈 比 如 硬盘 驱动 器 和 闪存 驱动 器 ) 进行 较 低 
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层次 的 直接 交互 。 该 工具 可 以 用 来 编辑 、 删 除 以 及 创建 设备 分 区 。 使 用 闪存 前 ， 
我 们 必须 首先 将 其 卸载 〈 如 果 需 要 的 话 ) 然后 再 启动 fdisk 程序 : 


[meelinuxbox ~]$ sudo umount /dev/sdb1 
[me@linuxbox ~]$ sudo fdisk /dev/sdb 


请 注意 使 用 fdisk 命令 指定 设备 时 , 设备 名 要 是 整个 设备 的 而 不 是 分 区 号 。 
程序 启动 后 ， 会 出 现下 面 的 提示 信息 : 


Command (m for help): 


输入 m 后 会 出 现下 面 的 程序 菜单 : 


Command action 

toggle a bootable flag 

edit bsd disklabel 

toggle the dos compatibility flag 
delete a partition 

list known partition types 

print this menu 

add a new partition 

create a new empty DOS partition table 
print the partition table 

quit without saving changes 
create a new empty Sun disklabel 
change a partition's system id 
change display/entry units 

verify the partition tabile 

write table to disk and exit 
extra functionality (experts only) 


xX<cAAWoADo0o3~Aa0on 


Command (m for help): 
首先 查看 现 有 磁盘 分 区 布局 ， 可 以 通过 输入 字母 p 打印 显示 设备 的 分 区 表 : 


Command (m for help): p 


Disk /dev/sdb: 16 MB ，16006656 bytes 
1 heads, 31 sectors/track, 1008 cylinders 
Units = cylinders of 31 * 512 = 15872 bytes 


Device Boot Start End Blocks Id System 
/dev/sdb1 2 1008 15608+ b W95 FAT32 


可 以 看 到 此 例 中 使 用 的 是 一 个 16MB 大 小 的 、 仅 有 一 个 分 区 的 闪存 ， 并 且 
只 使 用 了 可 用 的 1008 个 磁 柱 〈Cylinder) 中 的 1006 个 。 该 分 区 被 识别 为 是 
Windows 95 FAT32 类 型 的 分 区 ， 虽 然 有 些 程序 会 利用 此 身份 标识 来 限制 对 磁盘 
可 进行 的 操作 种 类 ， 但 大 多 数 时 候 改 不 改变 该 标识 无 关 紧 要 。 然 而 ， 作 为 示范 ， 
我 们 还 是 需要 将 其 改 为 Linux 类 型 的 分 区 。 为 此 ， 首 先 我 们 得 知道 Linux 分 区 使 
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用 哪个 身份 识别 ID 码 。 从 上 表 可 以 看 出 ， 字 母 b 表示 Windows 95 FAT32 类 型 
的 分 区 。 于 是 我 们 就 需要 查看 有 效 分 区 类 型 对 照 表 ， 参 照 先前 的 程序 菜单 ， 我 
们 可 以 看 到 下 面 的 菜单 选项 ; 


1 list known partition types 


按照 提示 输入 1， 一 张 包含 所 有 可 能 分 区 类 型 的 对 照 表 便 显示 出 来 。 查 表 ， 
可 以 看 到 现 有 的 分 区 类 型 用 b 表示 ， 而 Linux 分 区 类 型 则 用 83 表示 。 


回 到 程序 菜单 ， 会 看 到 用 来 改变 分 区 IDD 的 菜单 选项 : 
t change a partition's system id 
在 提示 命令 框 中 输入 t 和 新 的 ID: 


Command (m for help): t 

Selected partition 1 

Hex code (type L to list codes): 83 

Changed system type of partition 1 to 83 (Linux) 


完成 了 分 区 加 的 修改 ， 到 目前 为 止 , 设备 一 直 处 于 末 开 发 状态 (所 有 的 变 
化 都 储存 在 了 内 存 中 而 非 物理 设备 上 )， 所 以 下 一 步 我 们 就 该 向 设备 写 入 修改 后 
的 分 区 表 ， 然 后 退出 。 
在 提示 界面 中 输入 w 完成 上 述 操作 : 
Command (m for help): w 
The partition table has been altered! 
Calling ioctl() to re-read partition table. 
WARNING: If you have created or modified any DOS 6.x 
partitions, please see the fdisk manual page for additional 
information. 


Syncing disks. 
[meelinuxbox ~]$ 


如 果 不 打 算 对 设备 做 任何 改动 ， 可 以 输入 q， 这 样 就 可 以 不 保存 改动 而 退出 
程序 了 。 在 此 过 程 中 ， 我 们 可 以 毫 无 顾忌 地 忽略 那些 冠冕 堂皇 的 警告 信息 。 


15.2.2 用 mkfs 命令 创建 新 的 文件 系统 


分 区 编辑 已 经 完成 (虽然 可 能 无 足 轻 重 )， 我 们 便 可 以 在 闪存 上 创建 新 的 
文件 系统 。mkfs (make filesystem 的 缩写 ) 命令 可 以 用 来 创建 各 种 类 型 的 文件 
系统 ， 例 如 我 们 要 在 设备 上 创建 ext3 文件 系统 ， 那 就 在 想 要 格式 化 分 区 的 设备 
名 前 面 使 用 -t 参数 选项 指明 创建 的 文件 系统 是 ext3 类 型 。 
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[me@linuxbox ~]$ sudo mkfs -t ext3 /dev/sdb1 
mke2fs 1.40.2 (12-Jul-2012) 

Filesystem label= 

OS type: Linux 

Block size=1024 (109g=0) 

Fragment size=1024 (10g=0) 

3904 inodes, 15608 blocks 

780 blocks (5.00%) reserved for the super user 
First data block=1 

Maximum filesystem blocks=15990784 

2 block groups 

8192 blocks per group, 8192 fragments per group 
1952 inodes per group 

Superblock backups stored on blocks: 

’ 8193 


Writing inode tables: done 
Creating journal (1024 blocks): done 
Writing superblocks and filesystem accounting information: done 


This filesystem will be automatically checked every 34 mounts or 
180 days, whichever comes first. Use tune2fs -c or -i to override. 
[me@linuxbox ~]$ 


当 ext3 是 指定 的 文件 系统 类 型 ， 该 程序 会 输出 许多 信息 。 如 果 要 将 该 设备 
重新 格式 化 为 原来 的 FAT32 文件 系统 ， 则 用 vfat 作为 -t 的 选项 参数 。 


[me@linuxbox ~]$ sudo mkfs -t vfat /dev/sdb1 


这 种 分 区 及 格式 化 过 程 适用 于 任何 有 额外 存储 设备 插入 系统 的 时 候 。 虽 然 
此 处 仅仅 用 闪存 作为 例子 讲解 ， 但 这 样 的 过 程 同样 适用 于 内 部 硬盘 以 及 其 他 像 
USB 磁盘 驱动 器 之 类 的 可 移动 存储 设备 。 


15.3 测试、 修复 文件 系统 


前 面 在 讨论 /etc/fstab 文件 的 时 候 ， 我 们 会 看 到 每 一 行 的 末尾 有 许多 神秘 的 
数字 。 系 统 每 次 启动 时 ， 挂 载 文件 系统 前 都 会 惯例 性 地 检查 文件 系统 的 完整 性 ， 
此 检查 过 程 是 由 fsck (filesystem check 的 缩写 ) 程序 完成 的 ，fstab 文件 每 个 条 
目 末 尾 的 数字 正 是 对 应 设备 的 检查 优先 级 。 由 上 例 中 的 fstab 文件 可 知 ， 根 目录 
首先 被 检查 ， 然 后 就 是 home 目录 和 boot 目录 ， 末 尾数 字 是 0 的 设备 表示 不 执 
行 惯 例 性 检查 。 . 

除了 检查 文件 系统 的 完整 性 外 ，fsck 还 能 修复 损坏 的 文件 系统 ， 修 复 程度 
取决 于 损坏 程度 。 对 于 类 UNIX 文件 系统 , 已 修复 的 文件 会 存放 在 文件 系统 根 
目录 下 的 lost + found 目录 中 。 
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下 面 的 命令 可 以 用 来 检查 闪存 《闪存 事先 应 该 已 卸载 ) 


[me@linuxbox ~]$ sudo fsck /dev/sdb1 

fsck 1.40.8 (13-Mar-2012) 

e2fsck 1.40.8 (13-Mar-2012) 

/dev/sdb1: clean, 11/3904 files, 1661/15608 blocks 


依据 我 的 经 验 ， 除非 出 现 像 磁盘 驱动 器 不 能 工作 这 样 的 硬件 问题 ， 不 然 文 
件 系统 损坏 是 非常 少见 的 。 多 数 系统 ， 如 果 在 启动 期 间 检测 到 文件 系统 损坏 ， 
系统 会 自动 停止 加 载 并 且 引 导 你 运行 fsck 程序 。 


fsck 是 什么 
在 UNIX 文化 中 ，fsck 通常 用 来 取代 一 个 与 它 有 3 个 字母 相同 的 流行 词 
(fuck )。 这 确实 很 合适 ， 因 为 当 你 处 于 被 连 运 行 fsck 程序 的 情况 时 ， 你 很 有 
可 能 不 自然 地 就 会 蹦 出 fuck。 


15.4 格式 化 软盘 


对 于 那些 仍然 使 用 配备 软盘 驱动 器 的 老式 电脑 的 用 户 ， 同 样 可 以 管理 这 些 
软盘 设备 。 如 何 准备 一 张 空白 软盘 ? 首先 ， 我 们 对 软盘 进行 一 个 低级 格式 化 操 
作 ， 然 后 创建 一 个 文件 系统 。dformat 程序 后 面 输入 指定 的 软盘 设备 名 〈 通 
常 是 /dewfd0) 即 可 完成 格式 化 操作 : 


[me@linuxbox ~]$ sudo fdformat /dev/fd0 

Double-sided, 80 tracks, 18 sec/track. Total capacity 1440 kB. 
Formatting ... done - 
Verifying ... done 


接 下 来 用 mkfs 命令 为 软盘 创建 一 个 FAT 文件 系统 。 
[me@linuxbox ~]$ sudo mkfs -t msdos /dev/fd0 


请 注意 ， 这 里 我 们 使 用 msdos 文件 系统 类 型 以 期 获得 更 小 更 早 类 型 的 文件 分 配 
表 。 软 盘 准 备 工作 完成 后 ， 就 可 以 像 其 他 设备 一 样 被 挂 载 。 


15.5 直接 从 /向 设备 转移 数据 


虽然 ， 我 们 通常 认为 电脑 上 的 数据 都 是 以 文件 的 形式 存储 的 ， 但 也 有 可 能 
会 认为 数据 以 “原始 ”形式 存储 。 以 磁盘 驱动 器 为 例 ， 它 包含 了 许多 被 操作 系 
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统 当 作 目 录 或 文件 的 数据 “ 块 " 如 果 可 以 简单 地 把 磁盘 驱动 器 当 作 一 个 大 数据 块 
集 ， 那 么 我 们 就 可 以 执行 一 些 有 用 任务 ， 诸 如 克隆 设备 等 。 


dd 程序 可 以 完成 这 样 的 任务 ， 该 命令 将 数据 块 从 一 个 地 方 复制 到 另 一 个 地 方 。 
由 于 历史 原因 ， 该 命令 使 用 句法 比较 独特 ， 其 格式 如 下 : 


dd if=input FitIe of=output file [bs=block size [count=blocks]] 


假定 现在 有 两 个 容量 一 样 的 U 盘 ， 并 且 我 们 希望 将 第 一 个 器 盘 里 面 的 内 容 
准确 完全 地 复制 到 第 二 个 U 盘 里 面 。 如 果 这 两 个 盘 都 已 经 连接 到 电脑 上 并 且 它 
们 的 设备 名 分 别 为 /dev/sdb 和 设备 /devsdc， 那 么 我 们 就 可 以 用 下 面 的 命令 行将 
第 一 个 盘 上 的 所 有 内 容 复 制 到 第 二 个 盘 上 : 


dd if=/dev/sdb of=/dev/sdc 


. 或者， 如 果 只 有 第 一 个 盘 连 接 到 电脑 上 ， 那 么 我 们 可 以 将 其 内 容 先 复制 到 
一 个 普通 的 文件 里 以 备 后 续 储 存 或 复制 : 


dd if=/dev/sdb of=flash_drive.img 


警告 dd 命令 功能 很 强大 。 尽管 该 命令 是 由 data definition 两 个 单词 缩写 而 来 ， 但 
有 时 亦 被 称 为 “destroy disk”( 摧毁 磁盘 )， 因 为 使 用 者 经 常 把 证 或 是 or 后 面 指 
定 的 设备 名 输 错 。 一 定 要 记 住 命令 输入 结束 按 Enter 键 前 要 反复 检查 你 指定 的 输 
入 输出 是 否 与 你 的 本 意 一 致 。 


15.6 创建 CD-ROM 映像 


向 CD-ROM (CD-R 或 是 CD-RW) 写 入 数据 包括 两 个 步骤 : 首先 ， 创 建 一 个 
ISO 映像 文件 ， 也 就 是 CD-ROM 文件 系统 映像 ， 其 次 ， 将 此 映像 文件 写 入 到 CD-ROM 
(只 读 光 盘 ) 介质 中 。 


15.6.1 创建 一 个 CD-ROM 文件 映像 副本 


如 果 我 们 想 给 现 有 的 CD-ROM 创建 一 个 ISO 映像 ， 可 以 使 用 dd 命令 将 
CD-ROM 中 所 有 数据 块 复制 到 本 地 某 个 文件 。 假 定 我 们 有 一 张 Ubuntu 的 CD 光 
盘 ， 并 打算 创建 一 个 ISO 文件 以 便 后 续 制 作 更 多 副本 。CD 光盘 被 插入 且 其 设备 
名 被 确定 后 (假设 是 /dev/cdrom)， 我 们 便 可 以 制作 ISO 文件 ， 
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dd if=/dev/cdrom of=ubuntu.iso 
该 方法 同样 适用 于 数据 类 DVD， 但 不 适用 于 音频 DVD， 因 为 音频 DVD 并 
不 使 用 文件 系统 实现 存储 。 对 于 音频 CD， 可 以 使 用 cdrdao 命令 。 


用 其 他 名 字 命 名 的 程序 …… 

如 果 你 曾经 看 过 创建 和 刻录 CD-ROM 和 DVD 之 类 的 光学 介质 的 在 线 教 
程 ， 你 肯定 常 听 到 mkisofs 和 cdrecord 这 两 个 程序 。 这 两 个 程序 包含 在 叫做 
cdtools 的 非常 受 欢迎 的 软件 包 里 ，J6rg Schilling 是 该 软件 包 的 作者 。2006 年 的 
夏天 ，Schilling 先生 对 cdtools 软件 包 中 的 部 分 内 容 提 出 了 许可 证 变更 , 但 是 这 
些 变 更 在 许多 Linux 社区 的 人 看 来 与 GNU 通用 公共 许可 证 不 兼容 。 结 果 ，cdtools 
项 目 便 开始 分 又 了 ， 包 括 cdrecord 和 mkisof 程序 分 别 被 wodim 和 genisoimage 
取代 。 


15.6.2 ”从 文件 集合 中 创建 映像 文件 


enisoimage 程序 通常 用 于 创建 包含 一 个 目录 内 容 的 ISO 映像 文件 。 首 先 我 们 创 
建 一 个 目录 ， 该 目录 包含 了 所 有 我 们 希望 加 进 映 像 文件 里 的 文件 ， 然 后 运行 
enisoimage 程序 创建 映像 文件 。 例 如 ， 假 使 事先 我 们 已 经 创建 了 一 个 叫 
做 ~/cd-rom-files 的 文件 目录 ， 并 且 该 目录 中 包含 了 所 有 准备 装 入 CD-ROM 中 的 
文件 ， 那 么 接 下 来 ， 我 们 就 可 以 用 enisoimage 命令 创建 ISO 映像 文件 ， 示 例如 下 ;: 


genisoinage -0 cd-rom.iso -R -J -/cd-rom-files 


-R 选项 添加 了 人 允许 Rock Ridge 延伸 的 元 数据 ， 此 延伸 允许 在 Linux 中 使 用 
较 长 文件 名 的 文件 以 及 POSIX 风格 的 文件 。 同 样 ，-] 选项 允许 Joliet 延伸 ， 此 延伸 
允许 在 Windows 中 使 用 较 长 文件 名 的 文件 。 
15.7 向 CD-ROM 写 入 映像 文件 


映像 文件 创建 好 后 ， 下 一 步 便 是 将 其 刻录 进 光 学 介质 中 。 下 面 我 们 所 讨论 
的 大 部 分 命令 都 适用 于 CD-ROM 和 DVD 介质 。 


15.7.1 直接 挂 载 ISO 映像 文件 
当 ISO 映像 文件 仍 在 硬盘 上 时 ， 我 们 可 以 把 它 当 作 已 存在 于 光学 介质 中 ， 
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并 且 有 一 个 窗 门 可 以 实现 该 映像 文件 的 挂 载 。 那 就 是 通过 增加 -o loop 选项 来 挂 
载 (与 -t iso9660 文件 系统 类 型 参数 一 起 使 用 )， 如 此 便 可 以 把 映像 文件 当 作 设 
备 一 样 挂 载 在 文件 系统 树 上 了 。 


mkdir /mnt/iso_image 
mount -t is09660 -0 loop image.iso /nmnt/iso_image 


在 上 面 的 例子 中 ， 我 们 创建 了 一 个 叫做 /mnt/iso_image 挂 载 节点 并 将 
image.iso 映像 文件 挂 载 在 该 节点 上 。 映 像 文件 挂 载 成 功 后， 就 可 以 把 它 当 作 真 
实 的 CD-ROM 或 DVD。 记 住 ， 当 不 需要 该 映像 文件 的 时 候 要 将 其 印 载 。 


15.7.2 ” 擦 除 可 读 写 CD-ROM 


可 擦 写 CD-ROM 在 重用 之 前 需要 被 擦 除 或 清空 ， 我 们 可 以 通过 wodim 命令 
指定 光盘 刻录 机 操作 对 象 的 设备 名 以 及 所 要 执行 的 擦 除 类 型 来 完成 。wodim 程 
序 提供 多 种 擦 除 类 型 ， 最 基本 的 就 是 fast 类 型 。 


wodim dev=/dev/cdrw blank=fast 


15.7.3” 写 入 映像 文件 


同样 我 们 使 用 wodim 命令 写 入 映像 文件 ， 通 过 指定 写 入 的 光 介 质 刻录 设备 
的 名 字 以 及 映像 文件 的 名 字 来 完成 : 


wodim dev=/dev/cdrw image.iso 


除了 设备 名 和 映像 文件 名 ，wodim 命令 还 支持 很 多 的 选项 。 两 个 比较 常见 
的 就 是 -v 和 -dao 选项 ，-v 选项 强调 输出 显示 详细 信息 ， 而 -dao 选项 则 决定 光盘 
刻录 采用 一 次 刻录 模式 ， 这 种 模式 一 般 用 于 光盘 商业 化 生产 。wodim 命令 的 默认 
模式 是 一 次 轨道 模式 ， 一 般 用 于 录制 音乐 曲目 。 


15.8 ”附加 认证 


通常 ， 确 认 所 下 载 的 ISO 映像 文件 是 否 完整 大 有 必要 。 多 数 情 况 下 ，ISO 
映像 文件 的 发 行商 会 提供 一 个 校 验 和 文件 ， 校 验 和 是 通过 一 种 奇异 的 数学 计算 
得 到 而 以 数字 形式 表示 的 计算 值 ， 它 代表 了 目标 文件 的 内 容 。 即 便 文 件 内 容 只 
有 某 个 位 发 生 了 变化 ， 校 验 和 的 结果 也 会 有 很 大 不 同 。 通 常 我 们 使 用 md5sum 
程序 生成 校 验 和 ， 示 例如 下 ， 输 出 结果 是 一 个 独特 的 十 六 进 制 数 ， 
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mdSsum image.iso 
346354760f9bb7fbf85c96f6a3f94ece image.iso 


映像 文件 下 载 结束 后 ， 你 可 以 用 md5sum 命令 得 出 其 校 验 和 ， 并 与 供应 商 
提供 的 md5sum 校 验 和 数值 进行 比较 验证 。 


md5sum 程序 除了 用 来 检查 下 载 文件 的 完整 性 外 , 还 可 以 用 来 验证 新 刻录 的 
光学 介质 。 检 验光 学 介质 ， 首 先生 成 映像 文件 的 校 验 和 ， 然 后 再 生成 光学 介质 
的 校 验 和 ， 比 较 这 两 个 校 验 和 ， 就 可 以 判别 映像 文件 是 否 完整 地 写 入 光学 介质 。 
该 算法 的 关键 在 于 如 何 只 计算 光学 介质 中 包含 该 映像 文件 部 分 的 校 验 和 ， 党 用 
的 方法 如 下 , 计算 映像 文件 中 包含 的 2K 字 节 块 的 数量 (光学 介质 总 是 以 2K 字 
节 的 块 为 单位 进行 擦 写 )， 然 后 从 光学 介质 中 读 取 同样 多 数量 的 块 ， 计 算 这 些 块 
的 校 验 和 。 其 实 ， 有 些 类 型 的 光学 介质 是 不 需要 计算 块 数量 的 ， 像 一 次 刻录 模 
式 刻录 的 CD-R 就 可 以 直接 用 下 面 的 命令 行 检验 : 


md5sum /dev/cdrom 
346354760f9bb7fbf85c96f6a3f94ece /dev/cdrom 


但 是 也 有 许多 类 型 的 介质 像 DVD 这 类 的 ， 需 要 精确 计算 块 的 数量 ， 示 例如 下 。 
该 命令 行 检查 了 dvd-image.iso 映像 文件 的 完整 性 以 及 DVD 播放 器 内 /dev/dvd 
光盘 的 完整 性 。 你 能 弄 明 白 该 命令 行 的 工作 原理 吗 ? 


mdS5sum dvd-image.iso; dd if=/dev/dvd bs=2048 count=$(( S$(stat -c "%s" dvd-image 
"480) / 2048 )) | md5sum 


*1Os 


网 络 


在 网 络 连 接 方面 ，Linux 可 以 说 是 万 能 的 。Linux 工具 可 以 建立 各 种 网 络 系 


统 及 应 用 ， 包 括 防 火 墙 、 路 由 嚣 、 域 名 服务 器 、NAS【〔 网 络 附加 存储 〉 盒 等 。 


由 于 网 络 连 接 涉及 的 领域 很 广 ， 所 以 用 于 控制 、 配 置 网 络 的 命令 自然 很 多 。 


本 章 只 着 重 讲 一 些 经 常用 到 的 命令 ， 涉 及 网 络 监测 以 及 文件 传输 等 方面 。 此 外 ， 
我 们 还 会 探讨 一 下 用 于 远程 登录 的 ssh 命令 ， 所 涉及 的 命令 如 下 所 示 。 


ping: 向 网 络 主机 发 送 ICMP ECHO_REQUEST 数据 包 。 
traceroute: 显示 数据 包 到 网 络 主机 的 路 由 路 径 。 


netstat; 显示 网 络 连接 、 路 由 表 、 网 络 接口 数据 、 伪 连接 以 及 多 点 传送 成 
员 等 信息 。 


ftp: 文件 传输 命令 。 
lftp: 改善 后 的 文件 传输 命令 。 
wget: 非 交 互 式 网 络 下 载 器 。 
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。 ssh:; OpenSSH (SSH 协议 的 免费 开源 实现 ) 版 的 SSH 客户 端 〈 远 程 系统 
登录 命令 )。 

。 scp: secure copy 的 缩写 ， 是 远程 复制 文件 命令 。 

e sftp: secure file transfer program 的 缩写 ， 安 全 文件 传输 程序 。 


接 下 来 给 大 家 补充 一 些 网 络 方面 的 背景 知识 。 在 当今 这 个 互联 网 时 代 ， 
每 一 个 计算 机 用 户 都 需要 对 网 络 这 个 概念 有 一 个 基本 了 解 。 便 于 更 好 地 理解 本 
章 内 容 ， 首 先 熟悉 下 面 的 术语 。 


e。 IP (Internet protocol) address: 互联 网 协议 地 址 。 
。 host and domain name: 主机 名 和 域名 。 
。 URI (uniform resource identifier):; 统一 资源 标识 符 。 


下 面 涉及 到 的 一 些 命令 可 能 需要 安装 额外 的 软件 包 (取决 于 使 用 的 Linux 


版 本 )， 当 然 这些 软 件 包 可 以 从 所 使 用 的 Linux 版 本 的 库 源 中 下 载 。 另 外 ， 有 些 
命令 可 能 要 求 超级 用 户 的 权利 才能 执行 。 


16.1 检查 、 监 测 网 络 


即使 你 不 是 系统 管理 员 ， 经 常 检查 网 络 的 性 能 和 运行 情况 也 是 有 必要 的 。 


16.1.1 ping 一 一 向 网 络 主机 发 送 特殊 数据 包 


最 基本 的 网 络 连接 命令 就 是 ping 命令 。ping 命令 会 向 指定 的 网 络 主机 发 送 
特殊 网 络 数 据 包 IMCP ECHO_REQUEST。 多 数 网 络 设备 收 到 该 数据 包 后 会 做 出 
回应 ， 通 过 此 法 即 可 验证 网 络 连接 是 否 正常 。 


有 时 从 安全 角度 出 发 ， 通 常会 配置 部 分 网 络 通信 设备 (包括 Linux 主机 ) 
以 忽略 这 些 数 据 包 ， 因 为 这 样 可 以 降低 主机 遭受 潜在 攻击 者 攻击 的 可 能 性 。 当 
然 ， 防 火 墙 经 常 被 设置 为 阻碍 IMCP 通信 。 


例如 ， 想 要 验证 是 否 可 以 登录 网 站 http:/www.linuxcommand.org/〈 我 最 喜 
欢 登录 的 网 站 之 一 )， 可 以 按 如 下 方式 使 用 ping 命令 。 
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[meelinuxbox ~]$ ping linuxcommand.org 


一 旦 程序 启动 ，ping 命令 便 以 既定 的 时 间 间 隔 〈 默 认 是 18) 传送 数据 包 直 
到 该 命令 被 中 断 。 
[me@linuxbox ~]$ ping linuxcommand.org 


PING linuxcommand.org (66.35.250.210) 56(84) bytes of data. 
64 bytes from vhost.sourceforge.net (66.35.250.210):; icmp seq=1 tt1=43 time=10 


64 bytes from vhost.sourceforge.net (66.35.250.210): icmp_seq=2 tt1L=43 time=10 
64 bytes from vhost.sourceforge.net (66.35.250.210); icmp_ seq=3 ttl=43 time=10 
64' bytes from vhost.sourceforge.net (66.35.250.210): icmp_seq=4 tt1=43 time=10 
64' bytes from vhost,.sourceforge.net (66.35.250.210): icmp_seq=5 tt1=43 time=10 
64' bytes from vhost,.sourceforge.net (66.35.250.210): icmp_seq=6 tt1=43 time=10 
7 ms 


--- linuxcommand.org ping statistics --- 
6 packets transmitted, 6 received, 0% packet loss, time 6010ms 
rtt min/avg/max/mdev = 105.647/107.052/108.118/0.824 ms 


按 Ctrl-C 键 终止 ping 程序 〈 此 时 正好 是 本 例 中 第 6 个 数据 包 传输 结束 后 )， 
ping 程序 会 将 反映 运行 情况 的 数据 显示 出 来 。 数 据 包 丢失 0% 表 示 网 络 运行 正常 ， 
ping 连接 成 功 则 表明 网 络 各 组 成 成 员 〈 接 口 卡 、 电 缆 、 路 由 和 网 关 ) 总 体 处 于 
良好 的 工作 状态 。 


16.1.2 traceroute 一 一 跟踪 网 络 数据 包 的 传输 路 径 


traceroute 程序 《有 些 系统 则 使 用 功能 相仿 的 tracepath 程序 代替 ) 会 显示 文 
件 通 过 网 络 从 本 地 系统 传输 到 指定 主机 过 程 中 所 有 停靠 点 的 列表 。 下 例 列 出 了 
数据 在 连接 到 网 站 http://www.slashdot.org/ 时 所 经 过 的 站 点 。 


[me@linuxbox -]$ traceroute slashdot.org 
输出 如 下 内 容 。 


traceroute to slashdot.org (216.34.181.45)，30 hops max, 40 byte packets 

1 ipcop.localdomain (192.168.1.1) 1.066 ms 1.366 ms 1.720 ms 

2 申 味 闽 

3 ge-4-13-ur01.rockville.md.bad.comcast.net (68.87,.130.9) 14.622 ms 14.885 
ms 15.169 ms 

4 po-30-ur02.rockville.md.bad.comcast.net (68.87.129.154) 17.634 ms 17.626 
ms 17.899 ms 

5 po-60-ur03.rockville.md.bad,.comcast.net (68.87,.129.158) 15.992 ms 15.983 
ms 16.256 ms 

6 po-30-ar01.howardcounty .md.bad.comcast ,net (68.87.136.5) 22.835 ms 14,23 
3 ms 14.405 ms 
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7 po-10-ar02.whitemarsh.md.bad,.comcast.net (68.87.129.34) 16.154 ms 13.600 
ms 18.867 ms 

8 te-0-3-0-1-cr01.philadelphia.pa.ibone.comcast.net (68.86.90.77) 21.951 ms 
21.073 ms 21.557 ms 

9 pos-0-8-0-0-cr01.newyork.ny.ibone.comcast.net (68.86.85.10) 22.917 ms 21 
-884 ms 22.126 ms 

10 204.70.144.1 (204.70.144.1) 43.110 ms 21.248 ms 21.264 ms 

11 cr1-pos-0-7-3-1.newyork.savvis.net (204.70.195.93) 21.857 ms cr2-pos-0-0- 
3-1.newyork.savvis.net (204.70.204.238) 19.556 ms cr1-pos-0-7-3-1.newyork.sav 
vis.net (204.70.195.93) 19.634 ms 

12 cr2-pos-0-7-3-0.chicago.savvis.net (204.70.192.109) 41.586 ms 42.843 ms 
cr2-tengig-0-0-2-0.chicago.savvis.net (204.70.196.242) 43.115 ms 

13 hr2-tengigabitethernet-12-1.elkgrovech3.savvis.net (204.70.195.122) 44.21 
5 ms 41.833 ms 45.658 ms 

14 csri-ve241.elkgrovech3.savvis.net (216.64.194.42) 46.840 ms 43.372 ms 4 
7.041 ms 

15 64.27.160.194 (64.27.160.194) 56.137 ms 55.887 ms 52.810 ms 

16 slashdot.org (216.34.181.45) 42.727 ms 42.016 ms 41.437 ms 


由 该 列表 可 知 ， 从 测试 系统 到 http://www.slashdot.org/ 网 站 的 连接 需要 经 过 
16 个 路 由 器 。 对 于 那些 提供 身份 信息 的 路 由 器 ， 此 列表 则 列 出 了 它们 的 主机 名 、 
IP 地 址 以 及 运行 状态 信息 ， 这 些 信息 包含 了 文件 从 本 地 系统 到 路 由 器 3 次 往返 
时 间 。 而 对 于 那些 因为 路 由 器 配置 、 网 络 堵塞 或 是 防火 墙 等 原因 不 提供 身份 信 
息 的 路 由 器 ， 则 直接 用 星 号 行 表示 ， 如 上 面 输出 信息 中 的 2 号 停靠 站 。 


16.1.3 ”netstat 一 一 检查 网 络 设 置 及 相关 统计 数据 


netstat 程序 可 以 用 于 查看 不 同 的 网 络 设置 及 数据 。 通 过 使 用 其 丰富 的 参数 
选项 ， 我 们 可 以 查看 网 络 启 动 过 程 的 许多 特性 。 示 例如 下 ， 使 用 -ie 选项 ， 我 们 
可 以 检查 系统 中 的 网 络 接口 信息 。 


[me@linuxbox ~]$ netstat -ie 

etho Link encap:Ethernet HWaddr 00:1d:09:9b:99:67 
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0 
inet6 addr: fe80::21d:9ff:fe9b:9967/64 Scope:Link 
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 
RX packets :238488 errors:0 dropped:0 overruns:0 frame:0 
TX packets:403217 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:100 
RX bytes:153098921 (146.0 MB) TX bytes:261035246 (248.9 MB) 
Memory:fdfc0000-fdfe0000 


lo Link encap:Local Loopback 
inet addr:127.0.0.1 Mask:255.0.0.0 
inet6 addr: ::1/128 Scope:Host 
UP LOOPBACK RUNNING MTU:16436 Metric:1 
RX packets:2208 errors:0 dropped:0 overruns:0 frame:0 
TX packets:2208 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:0 
RX bytes:111490 (108.8 KB) TX bytes:111490 (108.8 KB) 
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以 上 的 输出 信息 显示 , 测试 系统 有 两 个 网 络 端口 : 第 一 个 称 为 eth0， 是 以 
太 网 端口 ， 第 二 个 称 为 10， 是 系统 用 来 自己 访问 自己 的 回环 虚拟 接口 。 


对 网 络 进行 日 常 诊断 , 关键 是 看 能 否 在 每 个 接口 信息 第 四 行 的 开头 找到 UP 
这 个 词 以 及 能 否 在 第 二 行 的 inet addr 字段 找到 有 效 的 了 PP 地址。 第 四 行 的 UP 代 
表 着 该 网 络 接口 已 启用 ,而 对 于 使 用 动态 主机 配置 协议 的 系统 (DHCP), inet addr 
字段 里 面 的 有 效 瑟 地 址 则 说 明了 DHCP 正在 工作 。- 


使 用 <r 选项 将 显示 内 核 的 网 络 路 由 表 ， 此 表 显 示 了 网 络 之 间 传 送 数 据 包 时 
网 络 的 配置 情况 。 


[me@linuxbox ~]$ netstat -r 

Kernel IP routing table 

Destination Gateway Genmask Flags MSS Window irtt Iface 
192.168.1.0 * 255.255.255.0 U 0 0 eth0 default 
192.168.1.1 0.0.0.0 UG 0 0 0 eth0 


此 例 显示 的 是 运行 在 防火 墙 /路 由 器 后 面 的 局 域 网 (LAN) 上 一 客户 端的 典 
型 路 由 表 。 该 表 的 第 一 行 表示 接收 方 的 卫 地 址 为 192.168.1.0, IP 以 0 结尾 表示 
接收 方 是 网 络 而 非 个 人 主机 ， 也 就 是 说 接收 方 可 以 是 局 域 网 CLAN) 上 的 任何 
主机 。 下 面 的 Gateway 参数 字段 ， 表 示 的 是 建立 当前 主机 与 目标 网 络 之 间 联 系 
的 网 关 〈 或 路 由 ) 的 名 称 或 卫 地址， 此 参数 值 是 星 号 表示 无 需 网 关 。 


最 后 一 行 包 含 默认 的 接收 方 ， 这 意味 着 所 有 通信 和 都 以 该 网 络 为 目的 地 。 上 
例 中 ， 网关 被 定义 为 IP 地 址 是 192.168.1.1 的 路 由 器 , 该 路 由 器 对 双方 通信 做 出 
最 佳 路 径 判 断 。 


netstat 程序 也 有 很 多 参数 选项 ， 而 以 上 只 列举 了 其 中 两 个 ， 要 了 解 其 整个 
参数 列表 可 以 查看 netstat 的 man 手册 页 。 


16.2 通过 网 络 传输 文件 


只 有 掌握 了 如 何 通 过 网 络 转移 文件 ， 才 会 明白 网 络 的 作用 之 大 。 有 许多 命令 
可 以 用 于 传送 网 络 数 据 ， 现 在 我 们 就 介绍 其 中 的 两 个 ， 后 续 章节 将 会 介绍 更 多 。 


16.2.1 ftp 一 一 采用 FTP ( 文件 传输 协议 ) 传输 文件 


ftp 是 Linux 比较 经 典 的 命令 之 一 ， 由 File Transfer Protocol 协议 缩写 而 来 。 
ftp 用 作 下 载 文件 工具 在 因特网 上 使 用 很 广泛 ， 大 多 数 Web 浏览 器 都 支持 fp 命 
令 ， 读 者 肯定 也 经 常 遇 到 以 ftp:// 协 议 开 头 的 URI。 
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ftp 程序 比 Web 浏览 器 出 现 得 早 , 它 用 来 与 FTP 服务 器 进行 通信 , 所 谓 FTP 
服务 器 就 是 那些 包含 供 网 络 上 传 、 下 载 文件 的 机 器 。 


FTP (原来 的 表示 形式 〉 并 不 安全 ， 因 为 它 以 明文 的 方式 传送 账户 名 以 及 
密码 。 这 意味 着 这 些 信息 并 没有 加 密 ， 任 何 一 个 接触 网 络 的 人 都 能 看 到 它们 。 
鉴于 此 ,几乎 所 有 使 用 FTP 协议 进行 的 网 络 文件 传输 都 是 由 匿名 FTP 服务 器 处 
理 的 。 匿 名 服务 器 允许 任何 人 使 用 anonymous 登录 名 以 及 无 意义 的 密码 登录 。 


下 面 是 一 个 典型 的 ftp 会 话 ， 其 功能 是 从 匿名 FTP 服务 器 fileserver 上 的 
/pub/cd_images/Ubuntu-8.04 目录 中 下 载 Ubuntu ISO 映像 文件 。 


[meelinuxbox ~]$ ftp fileserver 

Connected to fileserver.localdomain. 

220 (vsFTPd 2.0.1) 

Name (fileserver:me): anonymous 

331 Please specify the password. 

Password: 

230 Login successful. 

Remote system type is UNIX. 

Using binary mode to transfer files. 

ftp> cd pub/cd_images/Ubuntu-8.04 

250 Directory successfully changed. 

ftp> 1s 

200 PORT command successful. Consider using PASV. 

150 Here comes the directory listing. 

-PW-rw-r-- 1 500 500 733079552 Apr 25 03:53 ubuntu-8.04-desktop- 
i386.iso 

226 Directory send OK. 

ftp> led Desktop 

Local directory now /home/me/Desktop 

ftp> get ubuntu-8.04-desktop-i386.1s0 

local: ubuntu-8.04-desktop-i386.iso remote: ubuntu-8.04-desktop-i386.iso 
200 PORT command successful. Consider using PASV. 

150 Opening BINARY mode data connection for ubuntu-8.04-desktop-i386.iso 
(733079552 bytes). 

226 File send OK. 

733079552 bytes received in 68.56 secs (10441.5 kB/s) 

ftp> bye 


表 16-1 列 出 了 这 段 代码 中 所 输入 的 每 个 命令 行 的 含义 与 解释 。 
表 16-1 fp 命令 实例 


命令 代表 的 含义 
ftp fileserver 启动 fp 程序 ， 建 立 与 FTP 服务 器 fileserver 的 连接 

登录 名 ， 登 录 提 示 框 出 现 之 后 就 是 密码 输入 提示 框 。 一 些 服务 器 
anonymous 可 以 接受 空白 密码 ， 其 他 的 则 要 求 密码 以 邮件 地 址 的 形式 。 在 那 


样 的 情况 下 ， 就 尝试 user@example.com 这 样 的 格式 


, 打开 远程 系统 上 含有 所 需 文件 的 目录 。 注意， 对 于 多 数 匿名 服务 
cd pub/cd_images/Ubuntu-8.04 器 ， 供 公开 下 载 的 文件 一 般 都 存放 在 pub 目录 下 
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续 表 


命令 代表 的 含义 
ls 列 出 远程 系统 上 的 目录 列表 


切换 至 本 地 系统 的 ~/Desktop 目录 。 本 例 中 ，ftp 程序 是 在 home 
(~) 目录 下 启动 的 ， 此 命令 行将 工作 目录 切换 至 ~/Desktop 下 


告诉 远程 系统 将 ubuntu-8.04-desktop-i386.iso 映像 文件 发 送 给 本 地 
get ubuntu-8.04-desktop-i386.iso ”系统 。 由 于 本 地 系统 的 工作 目录 已 经 切换 至 ~/Desktop 下 ,映像 文 
件 也 会 下 载 到 该 目录 下 


E 注销 登录 远程 服务 器 并 且 结 束 ftp 程序 。 也 可 以 使 用 quit 或 exit 
2 命令 代替 


lcd Desktop 


在 提示 符 fp> 后 面 输入 help 会 显示 ftp 所 支持 的 命令 列表 。 在 已 被 授予 足够 
权限 的 服务 器 上 使 用 fp 命令 ， 可 以 执行 许多 常见 的 文件 管理 任务 。 昌 然 这 很 条 
拙 ， 但 这 不 失 为 一 种 办 法 。 


16.2.2 lftp 一 一 更 好 的 人 tp ( 文件 传输 协议 ) 


ftp 并 不 是 唯一 的 命令 行 FTP 客户 端 。 事实 上 ， 有 很 多 这 样 的 命令 行 。 其 中 
更 好 用 也 更 受 欢迎 的 一 个 就 是 由 Alexander Lukyanov 编写 的 lftp 命令 ， 它 与 传 
统 的 fp 程序 功能 类 似 但 却 有 很 多 额外 的 便利 功能 ， 包 括 多 协议 支持 HTTP)、 
下 载 失 败 时 自动 重新 尝试 、 后 台 进 程 支持 、Tab 键 完 成 文件 名 输入 等 许多 其 他 的 
功能 。 


16.2.3” wget 一 一 非 交 互 式 网 络 下 载 工具 


wget 是 另 一 个 用 于 文件 下 载 的 命令 行程 序 。 该 命令 既 可 以 用 于 从 网 站 上 下 
载 内 容 也 可 以 用 于 从 FTP 站 点 下 载 ， 单 个 文件 、 多 个 文件 甚至 整个 网 站 都 可 以 
被 下 载 。 下 例 演示 的 就 是 用 wget 命令 下 载 网 站 http:/www.linuxcommand.org/ 第 
一 页 内 容 。 


[meelinuxbox ~]$ wget http://linuxconmsand.org/index.php 
--11:02:51-- http://linuxcommand.org/index.php 

=> “index.php' 
Resolving linuxcommand.org... 66.35.250.210 
Connecting to linuxcommand.org|66.35.250.210|:80... connected. 
HTTP request sent, awaiting response... 200 OK 
Length: unspecified [text/html] 


[ <=> ] 3,120 --.--Ki/s 
11:02:51 (161.75 MB/s) - ‘index.php' saved [3120] 
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wget 命令 的 许多 参数 选项 支持 递归 下 载 、 后 台 文件 下 载 (允许 下 线 的 情况 
下 继续 下 载 ) 以 及 继续 下 载 部 分 被 下 载 的 文件 等 操作 。 这 些 特 点 都 清楚 的 写 在 
该 命令 的 better-than-average〈 优 于 平均 水 平 ) man 手册 页 中 。 


16.3 与 远程 主机 的 安全 通信 


多 年 以 前 ， 类 UNIX 操作 系统 就 可 以 通过 网 络 进行 远程 操控 。 早 期 ， 在 互 
联网 还 未 普及 的 时 候 , 登录 远程 主机 有 两 个 很 受 欢迎 的 命令 一 riogin 和 telnet 
命令 。 但 是 它们 与 fp 命令 有 着 相同 的 致命 缺点 ， 即 所 有 通信 信息 (包括 用 户 名 
和 密码 ) 都 是 以 明文 的 方式 传输 的 ， 所 以 它们 并 不 适用 于 互联 网 时 代 。 


16.3.1 ”ssh 一 一 安全 登录 远程 计算 机 


为 了 解决 明文 传送 的 问题 ， 一 个 叫做 SSH (Secure Shell 的 缩写 ) 的 新 协议 
应 运 而 生 。SSH 协议 解决 了 与 远程 主机 进行 安全 通信 的 两 个 基本 问题 : 第 一 ， 
该 协议 能 验证 远程 主机 的 身份 是 否 真实 ， 从 而 避免 中 间 人 攻击 ， 第 二 ， 该 协议 
将 本 机 与 远程 主机 之 间 的 通信 内 容 全 部 加 密 。 


SSH 协议 包括 两 个 部 分 : 一 个 是 运行 在 远程 主机 上 的 SSH 服务 端 ， 用 来 监 
听 端 口 22 上 可 能 过 来 的 连接 请 求 ， 另 一 个 是 本 地 系统 上 的 SSH 客户 端 ， 用 来 
与 远程 服务 器 进行 通信 。 

多 数 Linux 发 行 版 都 采用 BSD 项 目的 openSSH (SSH 的 免费 开源 实现 ) 方 
法 实现 SSH。 有 些 发 行 版 如 Red Hat 会 默认 包含 客户 端 包 和 服务 端 包 ， 而 有 的 
版 本 如 Ubuntu 则 仅仅 提供 客户 端 包 。 系 统 想 要 接收 远程 连接 ， 就 必须 安装 、 配 
置 以 及 运行 OpenSSH-server 软件 包 ， 并 且 必 须 允 许 TCP 端口 22 上 进来 的 网 络 
连接 〈 当 服务 器 正在 运行 防火 墙 或 是 在 防火 墙 后 面 时 )。 


如 果 没 有 可 以 连接 的 远程 系统 但 却 要 尝试 本 例 ， 可 以 在 系统 已 安装 了 


OpenSSH-server 软件 包 的 基础 上 将 远程 主机 名 设 为 本 地 主机 名 。 这 样 ， 机 器 便 
会 与 自身 建立 网 络 连接 。 


ssh 命令 作为 SSH 客户 端 程序 用 于 建立 与 远程 SSH 服务 器 之 间 的 通信 再 合 
适 不 过 了 。 如 下 便 是 使 用 ssh 客户 端 程序 来 建立 与 远程 主机 remote-sys 的 连接 的 
例子 。 


第 16 章 网 络 179 


[meelinuxbox ~]$ ssh remote-sys 

The authenticity of host 'remote-sys (192.168.1.4)' can't be established. 
RSA key fingerprint is 41:ed:7a:df:23;19:bf:3c:a5:17:bc:61:b3:7f:d9:bb. 
Are you sure you want to continue connecting (yes/no)? 


第 一 次 尝试 连接 的 时 候 ， 由 于 ssh 程序 从 来 没有 接触 过 此 远程 主机 ， 所 以 会 
跳出 一 条 “不 能 确定 远程 主机 真实 性 ”的 消息 。 当 出 现 这 条 警告 消息 的 时 候 输 
入 yes 接受 远程 主机 的 身份 ， 一 旦 建立 了 连接 ， 会 提示 用 户 输入 密码 。 


Warning: Permanently added ‘remote-sys,192.168.1.4' (RSA) to the list of known hosts. 
meeremote-SyS'S password: 


密码 输入 正确 后 ， 远 程 系统 的 shell 提示 符 便 出 现 了 。 


Last login: Tue Aug 30 13:00:48 2011 
[me@remote-sys ~]$ 


远程 shell 对 话 将 一 直 开 局 着 ， 直 到 用 户 在 该 对 话 框 中 输入 exit 命令 断 开 与 
远程 系统 的 连接 。 连 接 一 旦 断 开 后 ， 本 地 shell 会 话 恢复 ， 本 地 shell 提示 符 又 重 
新 出 现 。 


使 用 非 本 地 系统 上 使 用 的 用 户 名 也 可 以 登录 远程 系统 。 例 如 ， 当 本 地 用 户 
me 在 远程 系统 上 有 一 个 bob 账户 ，me 用 户 就 可 以 用 下 面 的 命令 登录 远程 系统 
上 的 bob 账户 。 


[me@linuxbox ~]$ ssh bob@renote-sys 
bobearemote-sys's password: 

Last login: Tue Aug 30 13:03:21 2011 
[bob@remote-sys ~]$ 


正如 前 面 所 说 ，ssh 命令 会 验证 远程 主机 的 真实 性 。 如 果 远 程 主机 没有 成 功 
验证 ， 就 会 跳出 下 面 的 警告 信息 。 


“ [me@linuxbox ~]$ ssh remote-sys 
eeeeeaeeeeaeaeaeaaeaaeaaeaeaaaeaaaaaaaaaaaaeaaaaaaaaaaaaaaaea 

@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @ 
@@aeaaaeeaaaaaaaeaaaaaaeaaaeaaaeaaeeaaaaaaaaaaaeeaaaaaaeaaaa 

IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY! 

Someone could be eavesdropping on you right now (man-in-the-middle attack)! 
It is also possible that the RSA host key has just been changed. 

The fingerprint for the RSA key sent by the remote host is 
41:ed:7a:df:23:19:bf:3c:a5:17:bc:61:b3:7f:d9:bb. 

Please contact your system administrator. 

Add correct host key in /home/me/.ssh/known_hosts to get rid of this message. 
Offending key in /home/me/.ssh/known_hosts:1 

RSA host key for remote-sys has changed and you have requested strict 
checking. 

Host key verification failed . 


一 般 有 两 个 原因 导致 此 警告 信息 : 第 一 ， 有 攻击 者 正在 尝试 中 间 人 攻击 ， 
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这 种 情况 很 少见 ， 因 为 大 家 都 知道 ssh 会 提醒 用 户 发 生 了 这 样 的 攻击 ; 第 二 , 也 
是 更 有 可 能 的 原因 便 是 远程 系统 在 某 种 程度 上 改变 了 ， 例 如， 远程 主机 重新 安 
装 了 操作 系统 或 者 SSH 服务 端 。 然 而 ， 从 安全 性 上 考虑 ， 不 应 该 因为 发 生 第 一 
种 情况 的 可 能 性 小 就 直接 忽略 , 该 警告 出 现时 仍然 要 向 远程 系统 的 管理 者 核对 。 

确定 该 警告 是 由 良性 原因 导致 后 ， 在 客户 端 修正 问题 就 安全 了 ， 解 决 方 法 
就 是 用 某 种 文本 编辑 器 (也 许 是 vim〉 从 ~/.ssh/known_hosts 文件 中 移 除 过 时 的 
密 钥 。 和 警告 当中 包含 如 下 这 人 旬 话 。 
Offending key in /home/me/.ssh/known_hosts:1 

这 意味 着 known_hosts 文件 的 第 一 行 包含 了 相悖 的 密 钥 。 将 该 行 删除 后 ，ssh 
程序 就 能 重新 获取 远程 系统 新 的 身份 验证 凭据 了 。 

ssh 命令 除了 能 开启 远程 系统 上 的 shell 会 话 外 ， 还 能 在 远程 系统 上 执行 单 
个 简单 命令 。 例 如 ， 我 们 可 以 在 remote-sys 远程 主机 上 执行 free 命令 并 将 其 结 
果 直 接 输出 到 本 地 系统 上 。 


[me@linuxbox -]$ ssh remote-sys free 
me@twin4's password: 


total used free shared buffers cached 
Mem: 775536 507184 268352 0 110068 154596 
-/+ buffers/cache: 242520 533016 
Swap: 1572856 0 1572856 


[me@linuxbox ~]$ 


该 特性 可 以 有 更 有 趣 的 用 途 ， 比 如 在 远程 系统 上 执行 ls 命令 后 直接 将 运行 
结果 输出 到 本 地 系统 的 文件 中 。 
[meelinuxbox ~]$ ssh remote-sys '1s *' > dirlist.txt 


me@twin4's password: 
[me@linuxbox -~]$ 


请 注意 命令 行 中 的 单 引 号 ， 之 所 以 使 用 单 引 号 是 因为 我 们 并 不 希望 本 该 在 
远程 主机 上 进行 的 路 径 扩展 在 本 地 系统 上 进行 。 同 样 ， 如 果 我 们 还 希望 执行 结 
果 能 直接 输出 到 远程 系统 的 文件 中 ， 就 应 该 将 重 定向 符号 和 文件 名 一 起 置 于 单 
引号 中 。 


[me@linuxbox ~]$ ssh remote-sys 'ls * > dirlist.txt' 


SSH 的 隧道 技术 
通过 SSH 与 远程 主机 建立 连接 后 ， 一 个 本 地 与 远程 系统 之 间 的 加 密 隧道 
就 被 建立 了 。 通 常 ， 该 隧道 用 于 将 在 本 地 系统 输入 的 命令 安全 地 传送 给 远程 
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系统 并 将 结果 安全 地 传送 回来 。 除 了 这 样 的 基本 功能 外 ，SSH 协议 还 可 以 在 
本 地 与 远程 系统 之 间 建 立 某 种 虚拟 专用 网 络 (VPN，Virtual Private Network )， 
从 而 实现 多 种 网 络 通信 经 此 加 密 隧道 传送 。 

也 许 ， 这 一 特性 最 常见 的 用 途 就 是 允许 X Window 系统 之 间 的 通信 。 在 
一 个 运行 X Window 服务 器 (也 就 是 使 用 图 形 用 户 接 口 的 机 器 ) 的 系统 上 ， 
可 以 远程 启动 和 运行 远程 主机 上 的 X Window (图 形 化 应 用 ) 客户 端 程序 并 将 
其 图 像 化 效果 显示 在 本 地 系统 上 。 这 个 过 程 操 作 起 来 很 容易 ， 假 定 我 们 正在 操作 
一 台 运 行 X Window 服务 器 的 叫做 linuxbox 的 本 地 主机 ， 并 打算 在 remote-sys 
远程 主机 上 远程 运行 xload 程序 , 还 要 在 本 地 主机 上 看 到 该 程序 运行 后 的 图 形 
化 效果 ， 示 例如 下 。 


[me@linuxbox ~]$ ssh -X remote-sys 
me@remote-sys's password: 
Last login: Mon Sep 05 13:23:11 2011 
[me@remote-sys ~]$ xload 
xload 命令 在 远程 系统 上 运行 后 ， 其 图 形 窗口 就 会 出 现在 本 地 系统 上 。 然 
而 对 于 某 些 系统 , 可 能 需要 用 -Y 参数 选项 而 不 是 像 上 面 所 用 的 -XX 选项 完成 该 
操作 。 


16.3.2 scp 和 sftp 一 一 安全 传输 文件 


OpenSSH 软件 包 包 含 了 两 个 使 用 SSH 加 密 隧道 进行 网 络 间 文件 复制 的 程 
序 ， scp (secure copy 的 缩写 ) 便 是 其 中 之 一 。 该 命令 与 普通 的 文件 复制 命令 
cp 类 似 ， 而 它们 之 间 最 大 的 差别 在 于 scp 命令 的 源 或 目的 地 路 径 前 面 多 个 远程 
主机 名 和 冒号 。 下 面 的 例子 实现 了 从 remote-sye 远程 系统 的 home 目录 中 将 
document.txt 的 文件 复制 到 本 地 系统 当前 工作 目录 下 的 操作 。 


[me@linuxbox ~]$ scp remote-sys:document.txt . 

me@remote-sys's password: 

document .txt 100% 5581 5.5KB/s 00:00 
[me@linuxbox ~]$ 


与 ssh 命令 一 样 , 如 果 不 是 用 本 地 系统 的 用 户 名 登录 远程 系统 , 那么 就 需 在 
远程 主机 名 前 添加 将 要 登录 的 远程 系统 的 账户 名 ， 示 例如 下 。 


[me@linuxbox ~]$ scp bobaremote-sys:document.txt . 


另外 一 个 SSH 文件 复制 程序 是 sftp。 顾 名 思 义 ， 它 是 fp 程序 的 安全 版 本 。 
sftp 与 我 们 先前 使 用 的 fp 程序 功能 极为 相似 ， 只 是 sftp 是 用 SSH 加 密 隧 道 传输 
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信息 而 不 是 以 明文 方式 传输 。sftp 相 比 传统 的 fp 而 言 ， 还 有 一 个 重要 的 优点 ， 
就 是 它 并 不 需要 远程 主机 上 运行 FTP 服务 器 ,仅仅 需要 SSH 服务 器 。 这 就 意味 
着 任何 与 SSH 客户 端 连接 的 远程 机 器 都 可 以 当 作 FTP 服务 器 使 用 , 下 面 就 是 一 
个 简单 的 会 话 实例 。 


[meelinuxbox ~]$ sftp remote-.sys 

Connecting to remote-sys... 

me@remote-sys's password: 

sftp> 1s 

ubuntu-8.04-desktop-i386.iso 

sftp> led Desktop 

sftp> get ubuntu-8.04-desktop-i386.iso 

Fetching /home/me/ubuntu-8.04-desktop-i386.iso to ubuntu-8.04-desktop-i386.iso 


/home/me/ubuntu-8.04-desktop-i386.iso 100% 699MB 7.4MB/s 01:35 
sftp> bye 


Linux 发 行 版 中 许多 图 形 文件 管理 器 都 支持 SFTP 协议 。 不管 系统 使 用 的 是 


Nautilus ( GNOME ) 图 形 界 面 还 是 Konqueror ( KDE ) 图 形 界面 ， 都 可 以 在 地 址 
栏 中 输入 以 sftp:// 开 头 的 URI， 并 对 存储 在 运行 SSH 服务 器 的 远程 系统 上 的 文 
件 进行 操作 。 


Windows 的 SSH 客户 端 

假使 你 正在 操作 一 台 Windows 系统 的 计算 机 ， 但 需要 登录 Linux 服务 器 
进行 一 些 实际 的 操作 。 该 怎么 办 ?当然 是 为 你 的 Windows 计算 机 配置 一 个 
SSH 客户 端 程序 ! 有 很 多 这 样 的 工具 。 最 受 欢迎 的 可 能 要 算 Simon Tatham 及 
其 团队 开发 的 PuTTY 程序 了 。PuTTY 程序 会 显示 一 个 终端 窗口 ， 并 允许 
Windows 用 户 在 远程 主机 中 打开 一 个 SSH (或 Telnet ) 会 话 ， 该 程序 也 提供 
与 scp 和 sftp 命令 功能 类 似 的 命令 。 

PuTTY 程序 可 以 从 http://www.chiark.greenend.org.uk/~sgtatham/putty/ 网 站 
上 上 下载 
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文件 搜索 


已 经 学 习 Linux 这 么 长 时 间 了 ， 相 信 大 家 有 一 点 已 经 很 清楚 ， 就 是 Linux 
系统 含有 非常 多 的 文件 ! 这 就 自然 产生 一 个 问题 ,“ 我 们 应 该 怎样 查找 东 


西 ? ”。 虽 然 我 们 已 经 知道 ，Linux 文件 系统 良好 的 组 织 结构 ， 源 自 于 类 UNIX 
的 操作 系统 代 代 传承 的 习俗 ， 但 是 仅 文 件数 量 就 会 引起 可 怕 的 问题 。 


本 章 我 们 主要 介绍 两 个 用 于 在 Linux 系统 中 搜索 文件 的 工具 。 
。 locate: 通过 文件 名 查找 文件 。 


。 find: 在 文件 系统 目录 框架 中 查找 文件 。 
同时 ， 我 们 也 会 介绍 一 个 通常 与 文件 搜索 命令 一 起 使 用 、 处 理 搜 索 结 果 文 件 
列表 的 命令 。 
。 xargs: 从 标准 输入 中 建立 、 执 行 命令 行 。 


此 外 ， 我 们 还 介绍 了 两 个 辅助 工具 。 
。 touch: 更 改 文件 的 日 期 时 间 。 
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。 stat: 显示 文件 或 文件 系统 的 状态 。 


17.1 locate 一 一 较 简 单 的 方式 查找 文件 


locate 命令 通过 快速 搜索 数据 库 , 以 寻找 路 径 名 与 给 定子 字符 串 相 匹配 的 文件 ， 
同时 输出 所 有 匹配 结果 。 例 如 ， 假 定 查找 名 称 以 zip 字符 串 开 头 的 程序 ， 由 于 
查找 的 是 程序 文件 ， 所 以 可 以 认为 包含 所 要 查找 的 程序 的 目录 名 应 以 bin/ 结 尾 。 
因此 ， 可 以 尝试 下 面 的 命令 行 。 


[me@linuxbox ~]$ locate bin/zip 


locate 程序 将 搜索 该 路 径 名 数据 库 , 并 输出 文件 名 包含 字符 串 bin/zip 的 所 
有 文件 。 


/usr/bin/zip 
iusr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/jzipsplit 


有 时 搜索 需求 并 不 是 这 么 简单 ， 这 时 便 可 以 用 locate 命令 结合 其 他 诸如 grep 
这 样 的 工具 实现 一 些 更 有 趣 的 搜索 。 


[me@linuxbox ~]$ locate zip | grep bin 
lbin/byunzip2 
/bin/bzip2 
/bin/bzip2recover 
/bin/gunzip 
/bin/gzip 
/usr/bin/funzip 
/usr/bin/gpg-zip 
/usr/bin/preunzip 
/usr/bin/prezip 
/usr/bin/prezip-bin 
/usr/bin/unzip 
/usr/bin/unzipsfx 
/usr/bin/zip 
/usr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/zipsplit 


locate 程序 已 经 使 用 了 很 长 时 间 ， 因 此 出 现 了 多 种 衍生 体 。slocate 和 mlocate 
是 现代 Linux 发 行 版 本 中 最 常见 的 两 个 衍生 体 ， 而 它们 通常 都 是 由 名 为 locate 的 
符号 链接 访问 。 不 同 版 本 的 locate 有 一 些 相同 的 选项 设置 ， 而 有 些 版 本 则 包括 
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正则 表达 式 匹配 〈 将 会 在 第 19 章 涉及 ) 和 通配符 支持 等 。 我 们 可 以 查看 locate 
的 man 手册 页 确定 系统 安装 的 是 哪个 版 本 的 locate。 


locate 的 搜索 数据 库 从 何 而 来 

你 也 许 曾 注意 过 ， 有 些 Linux 版 本 ， 系 统 刚 刚 安装 好 时 locate 命令 并 不 能 
工作 ， 但 是 如 果 第 二 天 再 尝试 ， 就 会 发 现 它 又 能 正常 工作 ， 这 到 底 是 怎么 回 
事 呢 ? 其 实 ,是 因为 locate 的 搜索 数据 库 由 另外 一 个 叫做 updatedb 的 程序 创建 ， 
通常 该 程序 作为 一 个 cron 任务 定期 执行 。 所 谓 cron 任务 就 是 指定 期 由 cron 
守护 进程 执行 的 任务 ， 多 数 装 有 locate 命令 的 系统 每 天 执行 一 次 updatedb 命 
令 。 由 此 可 见 ，locate 的 搜索 数据 库 并 不 是 持续 更 新 的 ， 所 以 locate 命令 查找 
不 到 非常 新 的 文件 。 解决 方 法 就 是 切换 为 超级 用 户 ， 在 提示 框 下 手动 运行 
updatedb 程序 。 
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locate 程序 查找 文件 仅仅 是 依据 文件 名 ， 而 find 程序 则 是 依据 文件 的 各 
种 属性 在 既定 的 目录 (及 其 子 目 录 ) 里 查找 。 本 章 将 会 花 大 量 的 篇 幅 介 绍 find 
命令 的 用 法 ， 因 为 它 有 很 多 有 趣 的 特性 会 在 后 面 有 关 编 程 概念 的 章节 中 多 次 
讲 到 。 


find 最 简单 的 用 法 就 是 用 户 给 定 一 个 或 是 更 多 目录 名 作为 其 搜索 范围 。 下 
面 就 用 find 命令 列 出 当前 系统 主 目录 (~) 下 的 文件 列表 清单 。 


[me@linuxbox ~]$ find ~ 


对 于 一 些 比较 活跃 的 用 户 ， 一 般 系统 内 文件 会 比较 多 ， 使 得 上 述 命 令 行 输 
出 的 列表 肯定 很 长 。 不 过 ， 列 表 信 息 是 以 标准 形式 输出 的 ， 所 以 可 以 直接 将 此 
输出 结果 作为 其 他 程序 的 输入 。 如 下 就 是 用 wc 程序 计算 find 命令 搜索 到 的 文 
件 的 总 量 。 


[meelinuxbox ~]$ find ~ | we -1 
47068 


大 家 忙碌 起 来 吧 ! find 命令 的 美妙 之 处 就 是 可 以 用 来 搜索 符合 特定 要 求 的 
文件 ， 它 通过 综合 应 用 test 选项 、action 选项 以 及 options 选项 (看 起 来 有 点 奇怪 ) 
.实现 高 级 文件 搜索 。 下 面 让 我 们 首先 了 解 test 选项 。 
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17.2.1 test 选项 
假定 我 们 想 要 查找 的 是 目录 文件 ， 我 们 可 以 添加 下 面 的 test 选项 达到 此 目的 。 


[me@linuxbox ~]$ find ~ -type d | we -1 
1695 


添加 test 参数 -type d 可 以 将 搜索 范围 限制 为 目录 , 而 下 面 例 子 中 使 用 -type f 
则 表示 只 对 普通 文件 进行 搜索 。 


[me@linuxbox ~]$ find ~ -type f | we -1 
38737 


表 17-1 列 出 了 find 命令 支持 的 常用 文件 类 型 。 
表 17-1 find 支持 搜索 的 文件 类 型 


文件 类 型 描述 

b 块 设备 文件 

c 字符 设备 文件 
d 目录 

f 普通 文件 

1 符号 链接 


另外 我 们 还 可 以 通过 添加 其 他 的 test 项 参数 实现 依据 文件 大 小 和 文件 名 的 搜 
索 。 如 下 命令 行 就 是 用 来 查找 所 有 符合 *.JPG 通配符 格式 以 及 大 小 超过 1MB 的 
普通 文件 。 


[meelinuxbox ~]$ find ~ -type f -name "*.JPG" -size +1M | we -1 
840 


本 例 中 添加 的 -name "*.JPG" 的 test 选项 表示 查找 的 是 符合 .JPG 通配符 格式 
的 文件 。 注 意 ， 这 里 将 通配符 扩 在 双 引 号 中 是 为 了 避免 shell 路 径 名 扩展 。 另 外 
添加 的 -size +1M .test 选项， 前 面 的 加 号 表示 查找 的 文件 大 小 比 给 定 的 数值 1M 
大 。 若 字符 串 前 面 是 减 号 则 代表 要 比 给 定数 值 小 ， 没 有 符号 则 表示 与 给 定 值 完 
全 相等 。 末 尾 的 M 是 计量 单位 MB《〈 兆 字 节 ) 的 简写 ， 表 17-2 中 列 出 了 每 个 字 
母 与 特定 计量 单位 之 间 的 对 应 关系 。 
表 17-2 find 支持 的 计量 单位 


字母 单位 
b 512 字 节 的 块 〈 没 有 具体 说 明 时 的 默认 值 ) . 
c 字 节 


w 两 个 字 节 的 字 
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续 表 
字母 单位 
k KB 每 单位 包含 1,024 字 节 ) 
M MB (每 单位 包含 1,048,576 字 节 》 
G GB 每 单位 包含 1,073,741,824 字 节 ) 


find 命令 支持 多 种 test 参数 ， 表 17-3 概括 了 一 些 常见 的 参数 。 注 意 ， 前 面 
所 讲述 的 “+” 和 “-” 号 的 用 法 适用 于 所 有 用 到 数值 参数 的 情况 。 


表 17-3 find 命令 的 test 项 参数 


test 参数 


描述 


-cminn 
-cnewer file 
-ctime n 
-empty 

-group name 
-iname pattern 
-inum nm 


-mminn 
-mtime n 


-name pattern 


-newer file 


-nouser 
-nogroup 


-perm mode 


-samefile name 
-size n 
-typec 


-user name 


匹配 n 分 钟 前 改变 状态 〈 内 容 或 属性 ) 的 文件 或 目录 。 如 
果 不 到 n 分钟， 就 用 -n， 如 果 超 过 n 分 钟 ， 就 用 +n 


匹配 内 容 或 属性 的 修改 时 间 比 文件 fe 更 晚 的 文件 或 目录 


匹配 系统 中 n*24 小 时 前 文件 状态 被 改变 〈 内 容 、 属 性 、 
访问 权限 等 ) 的 文件 或 目录 


匹配 空 文件 及 空 目录 


匹配 属于 name 组 的 文件 或 目录 。name 可 以 描述 为 组 名 ， 
也 可 以 描述 为 该 组 的 ID 号 


与 -name test 项 功能 类 似 只 是 不 区 分 大 小 写 


匹配 索引 节点 是 n 的 文件 。 该 test 选项 有 助 于 查找 某 个 特 
定 索引 节点 上 的 所 有 硬件 连接 


匹配 n 分 钟 前 内 容 被 修改 的 文件 或 目录 
匹配 n*24 小 时 前 只 有 内 容 被 更 改 的 文件 或 目录 
匹配 有 特定 通配符 模式 的 文件 或 目录 


匹配 内 容 的 修改 时 间 比 file 文件 更 近 的 文件 或 目录 。 这 在 
编写 shell 脚本 进行 文件 备份 的 时 候 非 常 有 用 。 每 次 创建 
备份 时 ， 更 新 某 个 文件 《比如 日 志 )， 然 后 用 find+ 此 参数 
选项 来 确定 上 一 次 更 新 后 哪个 文件 改变 了 


匹配 不 属于 有 效用 户 的 文件 或 目录 。 该 test 可 以 用 来 查找 那 
些 属于 已 删除 账户 的 文件 ， 也 可 以 用 来 检测 攻击 者 的 活动 


匹配 不 属于 有 效 组 的 文件 或 目录 


寻找 访问 权限 与 既定 模式 匹配 的 文件 或 目录 。 既定 模式 可 
以 以 八进制 或 符号 的 形式 表示 


与 -inum test 选项 类 似 。 匹 配 与 file 文件 用 相同 的 inode 号 
的 文件 


匹配 n 大 小 的 文件 
匹配 c 类 型 的 文件 


匹配 属于 name 用 户 的 文件 和 目录 。 name 可 以 描述 为 用 户 
名 也 可 以 描述 为 该 组 的 ID 号 
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以 上 并 不 是 test 参数 的 完整 列表 ,要 了 解 其 他 相关 内 容 可 以 查看 find 的 man 
手册 页 。 


操作 符 


即使 拥有 了 find 命令 提供 的 所 有 test 参数 ， 我 们 仍然 会 需要 一 个 更 好 的 工 
具 来 描述 test 参数 之 间 的 逻辑 关系 。 例 如 ， 如 果 我 们 需要 确定 某 目 录 下 是 否 所 
有 的 文件 和 子 目 录 都 有 安全 的 访问 权限 ， 该 怎么 办 ? 原则 上 就 是 去 查找 那些 访 
问 权 限 不 是 0600 的 文件 和 访问 权限 不 是 0700 的 子 目 录 。 幸 运 的 是 ，find 命令 
的 test 选项 可 以 结合 逻辑 操作 从 而 建立 具有 复杂 逻辑 关系 的 匹配 条 件 。 我 们 可 
以 用 下 面 的 命令 行 来 满足 上 述 find 命令 的 匹配 搜索 。 


[me@linuxbox ~]$ find ~ \( -type f -not -perm 0600 \) -or \( -type d -not -perg 0700 \) 
这 些 都 是 什么 ? 看 起 来 太 别扭 了 ! 不 过 ， 一旦 你 开始 了 解 逻 辑 操作 符 ， 就 
会 发 现 它们 并 没有 那么 复杂 了 〔 见 表 17-4)。 
表 17-4 find 命令 的 远 辑 操作 符 


操作 符 功能 描述 
查找 使 该 操作 符 两 边 的 检验 条 件 都 是 真 的 匹配 文件 。 有 时 直接 缩写 成 -a。 注 


-and (与 操作 ) 意 如 果 两 个 检测 条 件 之 间 没有 显 式 的 显示 操作 符 ，and 就 是 默认 的 逻辑 关系 
-or (或 操作 ) 查找 使 该 操作 符 任何 一 边 的 检测 条 件 为 真 的 匹配 文件 。 有 了 时 直接 缩写 成 -o 
-not (- 非 操作 ) 查找 使 该 操作 符 后 面 的 检测 条 件 为 假 的 匹配 文件 。 有 时 直接 缩写 成 - 
多 个 检测 条 件 和 逻辑 操作 符 -起 组 成 更 长 的 表达 式 ， 而 0 操作 就 是 用 来 区 分 
逻辑 表达 式 优先 权 的 。 默 认 的 情况 下 ，find 偷 令 从 左 向 右 运算 逻辑 值 。 然 而 
i 有 时 为 了 获得 想 要 的 结果 必须 扰乱 默认 的 执行 顺序 ， 即 便 不 需要 , 将 一 串 字 


符 表 达 式 括 起 来 对 提高 命令 的 可 读 性 也 很 有 帮助 。 请 注意 , 括号 字符 在 shell 
环境 中 有 特殊 意义 ， 所 以 必须 将 它们 在 命令 行 中 用 引号 引起 来 ， 这 样 才能 作 
为 find 的 参数 传递 。 通 常用 反 斜 杠 来 避免 这 样 的 问题 


对 照 这 张 逻 辑 操作 符 的 列表 ， 重 新 剖析 上 述 的 find 命令 行 。 从 最 全 局 的 角 

度 看 ， 所 有 检测 条 件 由 一 个 或 or) 操作 符 分 成 了 两 组 。 
(收益 式 1) -or (起 如 式 2) 

这 样 做 是 有 原因 的 ， 因 为 我 们 查找 的 是 具有 某 种 权限 设置 的 文件 和 另外 一 
种 权限 设置 的 目录 。 那 既然 要 同时 查找 文件 和 目录 , 怎么 不 是 用 and 而 是 用 or? 
因为 find 命令 在 浏览 扫描 所 有 的 文件 和 目录 时 ， 会 判断 每 一 个 文件 或 目录 是 否 
匹配 该 test 项 检测 条 件 。 而 我 们 的 目标 是 具有 不 安全 访问 权限 的 文件 或 是 具有 
不 安全 访问 权限 的 目录 ， 都 知道 匹配 者 不 可 能 既是 文件 又 是 目录 ， 所 以 不 能 用 
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and 逻辑 关系 。 由 此 ， 可 将 表达 式 扩充 如 下 。 
(file with bad perms) -or (directory with bad perms) 

接 下 来 的 问题 就 是 如 何 判断 文件 或 是 目录 具有 “危险 ”权限 ， 我 们 该 怎么 
做 昵 ? 事实 上 ， 我 们 并 不 需要 直接 去 寻找 “危险 ”权限 的 文件 或 是 目录 ， 而 是 
查找 那些 具有 “不 好 ”权限 的 文件 或 目录 , 因为 我 们 知道 什么 是 “好 的 权限 ”。 
对 于 文件 来 说 ， 权 限 是 0600 表示 “好 ”( 安 全 ) 的 ， 而 对 于 目录 ,“ 好 ”的 权限 
应 该 是 0700。 于 是 ， 判 断 具 有 “不 好 ”访问 权限 的 文件 的 表达 式 如 下 。 

-type f -and -not -perms 0600 

同样 ， 判 断 具 有 “不 好 ”访问 权限 的 目录 的 表达 式 如 下 。 
-type d -and -not -perms 0700 

正如 表 17-4 中 提 到 的 ，and 操作 是 默认 的 ， 所 以 可 以 安全 地 移 除 。 把 如 上 
表达 式 都 整理 到 一 起 以 下 。 
find ~ (-type f -not -perms 0600) -or (-type d -not -perms 0700) 

然而 ， 由 于 括号 在 shell 环境 下 有 特殊 含义 ， 所 以 我 们 必须 对 它们 进行 转 义 
以 防 shell 试图 编译 它们 。 在 每 个 括号 前 加 上 反 斜 杠 便 可 解决 此 问题 。 

逻辑 运算 符 的 另外 一 个 特性 也 很 值得 大 家 了 解 ， 有 如 下 两 个 被 逻辑 操作 符 
分 开 的 表达 式 。 


expr1 -operator expr2 
在 任何 情况 下 ， 表 达 式 exprl 都 会 被 执行 ， 而 中 间 的 操作 符 将 决定 表达 式 
expr2 是 否 被 执行 。 表 17-5 列 出 了 具体 执行 情况 。 


表 17-5 find 命令 的 and/or 逻辑 运算 


表达 式 expr1 的 结果 逻辑 操作 表达 式 expr2 执行 情况 .… 
真 and 总 是 执行 

假 and 不 执行 

真 or 不 执行 

假 or 总 是 执行 


为 什么 会 出 现 这 样 的 情况 ? 主要 还 是 为 了 提高 效率 , 以 -and 逻辑 运算 为 例 ， 
很 明显 表达 式 exprl -and expr2 的 值 在 exprl 为 假 的 情况 下 不 可 能 为 真 ， 所 以 就 
没有 必要 再 去 运算 表达 式 expr2 了 。 同 样 ， 对 于 表达 式 exprl -or expr2， 在 表达 式 
exprl 为 真 的 情况 下 其 逻辑 值 显然 为 真 ， 于 是 就 没有 必要 再 运算 表达 式 expr2 了 。 
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由 此 达到 效率 提高 的 目的 。 但 为 什么 这 一 性 质 这 么 重要 ? 这 是 因为 这 将 直 
接 影响 下 一 步 actions 选项 的 动作 行为 ， 下 面 就 来 介绍 actions 选项 。 


17.2.2 action 选项 


行动 起 来 吧 ! 前 面 find 命令 已 经 查找 到 所 需要 的 文件 ， 但 是 我 们 真正 想 做 
的 是 处 理 这 些 已 查找 到 的 文件 。 幸 运 的 是 ，find 命令 允许 直接 对 搜索 结果 执行 
动作 。 
预定 义 动作 
对 搜索 到 的 文件 进行 操作 ， 即 可 以 用 诸多 现成 的 预定 义 动作 指令 ， 也 可 以 
使 用 用 户 自 定义 的 动作 。 首 先 来 看 一 些 预 定义 动作 ， 见 表 17-6。 
表 17-6 预定 义 的 find 命令 操作 


动作 功能 描述 
-delete 删除 匹配 文件 
-ls 对 匹配 文件 执行 ls 操作 ， 以 标准 格式 输出 其 文件 名 以 及 所 要 求 的 其 他 信息 


将 匹配 的 文件 的 全 路 径 以 标准 形式 输出 。 当 没有 指定 任何 具体 操作 时 ， 该 操作 是 默认 
操作 


-Print 


-quit 一 县 匹配 成 功 便 退 出 


与 test 参数 选项 相 比 ，actions 参数 选项 数量 更 多 ， 可 以 参考 find 的 man 手 
册页 获取 更 全 面 信息 。 

本 章 开 头 所 举 的 第 一 个 例子 如 下 。 
find ~ 

此 命令 行 产 生 了 一 个 包含 当前 系统 主 (~) 目录 中 所 有 文件 和 子 目 录 的 列表 。 
该 列表 之 所 以 会 在 屏幕 上 显示 出 来 ， 是 因为 在 没有 指定 其 他 操作 的 情况 下 ，-print 
操作 是 默认 的 。 因 此 ， 上 述 命令 行 等 效 于 如 下 形式 的 命令 行 。 


find ~ -print 

当然 也 可 以 使 用 find 命令 删除 满足 特定 条 件 的 文件 。 示 例如 下 ， 此 命令 行 
用 于 删除 .BAK 〈 这 种 文件 一 般 是 用 来 指定 备份 文件 的 ) 后 缀 的 文件 。 
find ~ -type f -name '*.BAK' -delete 


本 例 中 ， 用 户主 目录 及 其 子 目录 下 的 每 个 文件 都 被 搜索 了 一 遍 匹 配 文件 名 
以 .BAK 结尾 的 文件 。 一 旦 被 找到 ， 则 直接 删除 。 
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毫 无 疑问 ， 在 使 用 -delete 操作 时 你 一 定 要 格外 小 心 。 最 好 先 用 -print 操作 确 
认 搜 索 结果 后 再 执行 -delete 删除 命令 。 


在 我 们 继续 讲 下 一 个 知识 点 前 , 先 来 补充 介绍 一 下 逻辑 运算 是 如 何 影响 find 的 
action 操作 的 。 仔 细 撕 摩 下 面 的 命令 。 


find ~ -type f -nane '*.BAK' -print 


正如 我 们 所 知道 的 ， 该 命令 行 用 来 查找 所 有 文件 名 以 .BAK 结尾 的 普通 文件 
C-type f) 并 且 以 标准 形式 〈-print) 输出 每 个 匹配 文件 的 相关 路 径 名 。 然 而 ， 该 
命令 行 之 所 以 照 这 样 的 方式 执行 是 由 每 个 test 选项 和 action 选项 之 间 的 逻辑 关 
系 决 定 的 。 记 住 ， 每 个 test 选项 和 action 选项 之 间 默 认 的 逻辑 关系 是 与 (and) 
逻辑 。 下 面 的 命令 行 逻辑 关系 能 看 得 更 清楚 些 。 


find ~ -type f -and -name '*.BAK' -and 一 Print 


如 上 便 是 完整 的 表达 式 ， 而 表 17-7 便 列 出 了 逻辑 运算 符 是 如 何 影响 action 
操作 的 。 


表 17-7 逻辑 运算 符 的 影响 


检测 条 件 /执行 操作 在 该 情况 下 执行 操作 
: -type 了 和 -name *.BAK' 条 件 都 匹配 时 ， 也 就 是 文件 是 普通 文件 并 且 
Pan 文件 名 也 是 以 .BAK 结尾 时 
-name * BAK' -typef 项 匹配 ， 也 就 是 说 文件 是 普通 文件 时 
pe 总 是 执行 ， 因 为 是 与 逻辑 关系 中 的 第 一 个 操作 数 


test 选项 与 action 选项 之 间 的 逻辑 关系 决定 了 它们 的 执行 情况 ， 所 以 test 选项 和 
action 选项 的 顺序 很 重要 。 例 如 ， 如 果 重 新 排列 这 些 test 选项 和 action 选项 ， 并 将 
-print 操作 作为 逻辑 运算 的 第 一 个 操作 数 ， 那 么 命令 行 的 运行 结果 将 会 有 很 大 的 不 同 。 
find ~ -print -and -type f -and -name '*.BAK' 

此 命令 行 会 把 每 个 文件 显示 出 来 〈 因 为 -print 操作 运算 值 总 是 为 真 )， 然 后 
再 对 文件 类 型 以 及 特定 的 文件 扩展 名 进行 匹配 检查 。 


用 户 自 定义 操作 


除了 已 有 的 预定 义 操作 命令 ， 同 样 也 可 以 任意 调用 用 户 想 要 执行 的 操作 命 
令 。 传 统 的 方法 就 是 像 以 下 命令 行使 用 -exec 操作 。 
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-exec command {} ; 

该 格式 中 的 command 表示 要 执行 的 操作 命令 名 ， 弛 花 括 号 代表 的 是 当前 
路 径 ， 而 分 号 作为 必需 的 分 隔 符 表示 命令 结束 。 使 用 -exec 完成 -delete 操作 示 
例如 下 。 


-exec rm ‘{}' ';!' 


同样 ， 由 于 括号 和 分 号 字符 在 shell 环境 下 有 特殊 含义 ， 所 以 在 输入 命令 行 
时 ， 要 将 它们 用 引号 引起 来 或 者 用 转 义 符 隔 开 。 


当然 ， 交 互 式 地 执行 用 户 自 定义 操作 也 不 是 不 可 能 。 通 过 使 用 -ok 操作 取代 
原来 的 -exec 操作 ， 每 一 次 指定 命令 执行 之 前 系统 都 会 询问 用 户 。 
find ~ -type f -name 'foo*' -ok ls -1 ‘'{}' ';' 
< 1s ... /home/me/bin/foo > ? y 
-rwxr-xr-x 1 me me 224 2011-10-29 18:44 /home/me/bin/foo 


< ls ... /home/me/foo.txt > ? y 
-rw-r--r-- 1 me me 0 2012-09-19 12:53 /home/me/foo.txt 


上 例 中 ， 查 找 文件 名 以 foo 字符 串 开 始 的 文件 ， 并 且 每 次 找到 匹配 文件 后 执 
行 ls -! 命令 。-ok 操作 会 在 ls 命令 执行 之 前 询问 用 户 是 否 执行 。 
提高 效率 

当 使 用 -exec 操作 时 ， 每 次 查找 到 匹配 文件 后 都 会 调用 执行 一 次 指定 命令 。 
但 有 时 用 户 更 希望 只 调用 一 次 命令 就 完成 对 所 有 匹配 文件 的 操作 。 例 如 ， 多 数 
人 可 能 更 喜欢 这 样 的 命令 执行 方式 。 


ls -1 file1 
ls -1 file2 


而 不 是 以 下 这 样 的 方式 。 
ls -1 file1 file2 

第 一 种 方式 只 需要 执行 命令 一 次 而 第 二 种 方式 则 要 多 次 重复 执行 。 实 现 这 
样 的 一 次 操作 有 两 种 方法 : 一 种 方式 比较 传统 ， 使 用 外 部 命令 xargs; 另 一 种 则 
是 使 用 find 本 身 自 带 的 新 特性 。 首 先 介绍 下 第 二 种 方法 。 


通过 将 命令 行 末尾 的 分 号 改 为 加 号 ， 便 可 将 find 命令 所 搜索 到 的 匹配 结果 
作为 指定 命令 的 输入 ， 从 而 一 次 完成 对 所 有 文件 的 操作 。 回 到 刚才 的 例子 。 
find ~ -type f -name 'foo*' -exec ls -1 '{} 


3 
-rwxr-xr-XxX 1 me me 224 2011-10-29 18:44 /home/me/bin/foo 
-rw-r--r-- 1me me 0 2012-09-19 12:53 /home/me/foo.txt 
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每 次 找到 匹配 文件 后 就 执行 一 次 ls 命令 。 将 上 述 命令 行 改 成 下 面 的 命令 行 。 


find ~ -type f -name 'foo*' -exec ls -1 ‘{}' + 
-Fwxr-xr-x 1 me me 224 2011-10-29 18:44 /home/mée/bin/foo 
-rw-r--r-- 1me me 0 2012-09-19 12:53 /home/me/foo.txt 


我 们 也 能 得 到 相同 的 结果 ， 但 是 系统 整体 只 执行 一 次 js 命令 。 


同样 我 们 可 以 使 用 xargs 命令 获得 相同 的 效果 ，xargs 处 理 标 准 输入 信息 并 
将 其 转变 为 某 指定 命令 的 输入 参数 列表 。 结 合 前 面 的 实例 ， 我 们 可 以 这 样 使 用 
xargs 命令 。 


find ~ -type f -name 'foo*' -print | xargs ls -1 
-rwxr-xr-x 1 me me 224 2011-10-29 18:44 /home/me/bin/foo 
-rw-r--r-- 1 me me 0 2012-09-19 12:53 /home/me/foo.txt 


该 命令 行 中 ，find 命令 的 执行 结果 直接 作为 xargs 输入 ，xargs 反 过 来 将 其 
转换 成 了 ls 命令 的 输入 参数 列表 ， 最 后 执行 ls 操作 。 


虽然 一 个 命令 行 中 可 允许 输入 的 参数 有 很 多 ， 但 这 并 不 表示 可 以 无 限 输入 ， 
也 存在 命令 行 过 长 而 使 得 shell 编辑 器 无 法 承受 的 情况 。 如 果 命 令 行 中 包含 的 输 
入 参数 太 多 而 超过 了 系统 支持 的 最 大 长 度 ，xargs 只 会 尽 可 能 对 最 大 数量 的 参数 
执行 指定 操作 ， 并 不 断 重复 这 一 过 程 直到 所 有 标准 输入 全 部 处 理 完毕 。 在 xargs 
命令 后 面 添加 --show-limits 选项 ， 即 可 知道 命令 行 最 大 能 承受 的 参数 数量 。 


处 理 有 趣 的 文件 名 

类 UNIX 系统 允许 文件 名 里 面 有 诅 入 的 空格 ( 甚至 换行 符 ! )， 这 会 给 像 
Xargs 这 些 为 其 他 程序 创建 参数 列表 的 命令 带 来 一 些 问 题 。 因 为 内 谱 的 空格 可 
能 会 被 当做 分 隔 符 ， 而 要 执行 的 操作 命令 可 能 会 把 空格 隔 开 的 单词 当做 不 同 
的 输入 参数 来 处 理 。 为 了 解决 这 一 问题 ，find 和 xargs 命令 允许 使 用 空 字符 作 
为 参数 之 间 的 分 隔 符 . 在 ASCII 码 中 , 空 字 符 是 由 数字 0 代表 的 字符 表示 (而 
空格 符 在 ASCII 码 中 是 由 数字 32 代替 )。find 命令 提供 -print0 这 一 action 选 
项 来 产生 以 空 字符 作为 各 参数 之 问 分隔 符 的 输出 结果 ， 而 xargs 命令 则 有 -null 
参数 选项 支持 xargs 接收 以 空 字 符 为 参数 分 隔 符 的 输入 。 示 例如 下 。 


find ~ -iname '*.jpg' -printO | xargs --null ls -1 


使 用 这 一 特性 ， 可 以 确保 所 有 的 文件 包括 那些 文件 名 中 马 售 内 崇 安 格 的 
文件 也 能 得 到 正确 的 处 理 。 
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17.2.3 ”返回 到 playground 文件 夹 


现在 可 以 实际 应 用 find 命令 了 。 首 先 让 我 们 创建 一 个 包含 很 多 子 目 录 及 
文件 的 playground 文件 夹 平台 。 


[me@iinuxbox ~]$ mkdir -p playground/dir-{00{1..9},0{10..99},100} 
[me@linuxbox ~]$ touch playground/dir-{00{1..9},0{10..99},100} /file-{A..2Z} 


不 得 不 惊叹 于 Linux 命令 行 的 威力 ! 简单 的 两 行 命令 ， 就 创建 了 一 个 包含 
100 个 子 目录 的 playground 文件 夹 ， 并 且 每 个 子 目录 中 又 包含 26 个 空 文件 。 你 
可 以 试 试用 图 形 用 户 界 面 GUI 能 否 这 么 快 得 达到 效果 ! 

我 们 用 来 创造 这 个 奇迹 的 方法 包含 一 个 熟悉 的 命令 mkdir、 一 个 奇异 的 
shell 花 括号 扩展 以 及 一 个 新 命令 touch。mkdir 命令 结合 -p 选项 (-p 选项 使 mkdir 
命令 按 指定 的 路 径 创 建 父 目录 ) 的 同时 用 花 括号 扩展 ， 便 完成 了 100 个 目录 的 
创建 。 


touch 命令 一 般 用 于 设 定 或 是 更 新 文件 的 修改 时 间 。 然 而 ， 当 文件 名 参数 是 
一 个 不 存在 的 文件 时 ， 那 么 该 命令 就 会 创建 一 个 空 文件 。 


playground 文件 夹 里 ， 总 共 创 建 了 100 个 叫做 file-A 的 文件 。 现 在 ， 我 们 可 
以 查找 它们 。 


meelinuxbox ~]$ find playground -type f -name 'file-A' 


请 注意 ， 与 ls 命令 不 同 ，find 命令 不 会 产生 有 排列 顺序 的 结果 ， 其 输出 顺序 
是 由 在 存储 设备 中 的 布局 决定 的 。 下 面 的 命令 行 验证 了 该 文件 夹 确实 有 100 个 
file-A 文件 。 


[me@linuxbox ~]$ find playground -type f -name 'file-A' | we -1 
100 


下 面 来 看 一 个 根据 文件 的 修改 时 间 查 找 文件 的 例子 ， 这 在 创建 备份 文件 以 
及 按时 间 顺 序 排列 文件 时 非常 有 用 。 首 先 需 要 创建 一 个 用 作 比 较 修 改 时 间 的 参 
照 文件 。 


[meelinuxbox ~]$ touch playground/timestamp 


该 命令 行 创建 了 一 个 名 为 timestamp 的 空 文件 ， 并 将 当前 时 刻 设 为 该 文件 的 
修改 时 间 。 我 们 可 以 使 用 另外 一 个 便捷 的 命令 stat 来 检验 执行 效果 ，stat 命令 
可 以 说 是 ls 的 增强 版 ,该 命令 会 将 系统 所 掌握 文件 的 所 有 信息 及 属性 全 部 显 
示 出 来 。 
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[me@linuxbox -1$ stat playground/timestamp 

File: ‘playground/timestamp’ 

Size: 0 Blocks: 0 IO Block: 4096 regular empty file 
Device: 803h/2051d Inode: 14265061 Links: 1 
Access: (0644/-rw-r--r--) Uid: ( 1001/ me) Gid: ( 1001/ me) 
Access: 2012-10-08 15:15:39.000000000 -0400 
Modify: 2012-10-08 15:15:39.000000000 -0400 
Change: 2012-10-08 15:;15:39.000000000 -0400 


当 我 们 再 一 次 对 此 文件 执行 touch 命令 并 用 stat 命令 检验 时 ， 会 发 现 文件 的 

时 间 得 到 了 更 新 。 
[me@linuxbox ~]$ touch playground/timestamp 
[me@linuxbox -}$ stat playground/timestamp 

File: “playground/timestamp， 

Size: 0 Blocks: 0 IO Block: 4096 regular empty file 
Device: 803h/2051d Inode: 14265061 Links: 1 
Access: {0644/-rw-r--r--)} Uid: ( 1001t/ me) Gid: ( 1001/ me) 
Access: 2012-10-08 15:23:33.000000000 -0400 


Nodify: 2012-10-08 15:23:33 ,000000000 -0400 
Change: 2012-10-08 15:23:33.000000000 -0400 


接 下 来 ， 我 们 便 可 以 用 find 命令 更 新 playground 文件 夹 里 的 一 些 文件 。 


[me@linuxbox -1$ find playground -type f -name 'file-B' -exec touch ‘'{}' ';' 


该 命令 行 更 新 了 playground 文件 夹 里 面 叫做 file-B 的 所 有 文件 。 下 面 我 们 
通过 比较 参照 文件 timestamp 与 其 他 文件 的 修改 时 间 ， 使 用 find 命令 查找 刚刚 被 
更 新 的 文件 。 . 


[me@linuxbox ~]$ find playground -type f -newer playground/timestamp 


命令 行 的 运行 结果 包含 100 个 文件 名 为 file-B 的 文件 。 由 于 我 们 是 在 对 
timestamp 文件 执行 了 touch 命令 之 后 ， 才 对 playground 文件 夹 中 对 名 为 file-B 
的 所 有 文件 执行 了 touch 操作 ， 所 以 它们 现在 要 比 timestamp 文件 新 ， 从 而 我 们 
可 选用 -newer test 选项 来 查找 。 


最 后 ， 回 顾 之 前 讨论 的 查找 不 安全 访问 权限 文件 的 例子 ， 并 将 其 用 于 
playground 目录 。 


[me@linuxbox -~]$ find playground \( -type f -not -perm 0600 \) -or \( -type d 
-not -perm 0700 \) 


该 命令 行列 出 了 playground 目录 下 的 所 有 的 100 个 子 目录 以 及 2600 个 文件 
《再 加 上 timestamp 文件 和 playground 自身 ， 总 共 2702 个 )， 之 所 以 全 部 列 出 是 
因为 playground 里 面 没 有 一 个 文件 满足 “安全 访问 权限 ”的 要 求 。 运 用 前 面 所 
学 find 命 令 的 operator 选 项 和 action 选项 的 知识 , 我 们 可 以 在 命令 后 面 增加 action 
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参数 选项 来 改变 playground 目录 下 文件 或 目录 的 访问 权限 。 


[me@linuxbox ~]$ find playground \{ -type f -not -perm 0600 -exec chmod 0600 
'{}' ;3' \) -or \( -type d -not -perm 0700 -exec chmod 0700 '{}’' ';' \) 


依据 日 常 经 验 ， 大 家 可 能 会 觉得 用 两 条 命令 一 一 分 别针 对 目录 和 文件 ， 
比 用 这 样 一 个 长 而 复杂 的 命令 容易 得 多 。 不 过 知道 这 一 知识 点 总 比 不 知道 好 ， 
此 处 的 重点 是 ， 要 了 解 如 何 结合 使 用 操作 符 选 项 与 行为 选项 ， 来 执行 一 些 有 用 
的 任务 。 


17.2.4 ”option 选项 


最 后 ， 我 们 谈 一 下 find 命令 的 option 选项 。option 选项 用 于 控制 find 命令 的 
搜索 范围 。 在 构成 find 命令 的 表达 式 时 , 它们 可 能 包含 在 其 他 测试 选项 或 行为 选 
项 之 中 。 表 17-8 列 出 了 最 常用 的 option 选项 。 


表 17-8 find 命令 的 option 选项 


选项 描述 
ee 引导 find 程序 处 理 目录 前 先 处 理 目录 内 文件 。 当 指定 -delete 操作 时 ， 该 参数 选项 
sp! 会 自动 调用 : 


-maxdepth levels 。 当 执 行 测试 条 件 行为 时 ， 设 置 find 程序 陷入 目录 数 的 最 大 级 别 数 
-mindepth levels 。 ”在 应 用 测试 条 件 和 行为 之 前 ， 设 置 find 程序 陷入 目录 数 的 最 小 级 别 数 
-mount 引导 find 不 去 遍历 挂 载 在 其 他 文件 系统 上 的 目录 


We 指导 find 程序 不 要 基于 “正在 搜索 类 UNIX 文件 系统 ”的 假设 来 优化 它 的 搜索 。 
当 扫描 DOS/Windows 文件 系统 和 CD 时 ， 会 用 到 该 选项 
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维护 系统 数据 安全 是 计算 机 系统 管理 者 的 基本 任务 之 一 , 及 时 创建 系统 文件 的 
备份 文件 是 维护 系统 数据 安全 的 一 种 常用 方法 。 即 便 对 于 非 系 统管 理 员 , 经 常 创建 
备份 文件 或 是 在 设备 之 间 、 文 件 夹 之 间 移 动 大 文件 集 通 常 都 是 非常 有 益 的 。 


本 章 会 介绍 一 些 用 于 管理 文件 集合 的 常用 命令 。 
文件 压缩 程序 ; 

。 gzip: 压缩 和 解压 缩 文件 工具 。 

。 bzip2: 块 排序 文件 压缩 工具 。 

文件 归档 程序 : 

。 tar: 磁带 归档 工具 。 

。 zip; 打包 和 压缩 文件 。 

文件 同步 程序 : 

。 rsync: 远程 文件 和 目录 的 同步 。 
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18.1 文件 压缩 


在 计算 领域 的 发 展 历史 中 ， 人 们 一 直 在 努力 实现 以 最 小 的 可 利用 空间 存储 
最 多 的 数据 ， 其 中 可 利用 空间 包括 内 存 、 存 储 设备 或 者 网 络 带 宽 。 许 多 如 今 认 
为 理所当然 的 数据 服务 ， 比 如 便携 式 音乐 播放 器 、 高 清 电 视 和 宽带 互联 网 等 之 
所 以 能 够 存在 ， 都 应 归功 于 有 效 的 数据 压缩 技术 。 


数据 压缩 是 一 个 移 除 数据 宛 余 信息 的 过 程 。 如 下 例 , 假设 有 一 张 100 x 100 
像素 的 全 黑 图 像 文件 ， 就 数据 存储 而 言 〈 假 设 每 个 像素 占用 24 位 ， 也 就 是 3 个 
字 节 )， 该 图 像 也 会 占用 30,000 (100 x 100 x 3 = 30,000) 字 节 的 存储 量 。 


一 幅 只 有 一 种 颜色 的 图 像 包 含 了 完全 元 余 的 数据 ， 我 们 要 是 聪明 的 话 ， 编 
码 该 图 像 数 据 时 可 以 直接 简单 地 描述 成 有 30,000 个 字 节 的 黑色 像素 。 因 此 ,无 
需 存储 一 个 包含 30,000 字 节 的 0 〈 图 像 文件 里 面 ， 黑 色 通 常用 零 表 示 ) 的 数据 
块 ， 而 是 将 这 些 数 据 压 缩 成 数字 30,000 和 一 个 0 来 表示 。 这 种 数据 压缩 技术 ， 
称 为 游程 编码 (run-lengh encoding)， 它 是 最 基本 的 一 种 压缩 技术 。 现 今 的 压缩 
技术 则 更 先进 、 更 复杂 ， 但 基本 目标 一 直 是 消除 元 余数 据 信息 。 


压缩 算法 (压缩 采用 的 数学 方法 ) 一 般 分 为 两 大 类 : 无 损 压 缩 与 有 损 压 缩 。 
无 损 压 缩 保 留 原文 件 中 的 所 有 数据 ， 也 就 是 说 这 种 方式 的 压缩 文件 还 原 时 ， 还 
原 后 的 文件 与 原文 件 完全 一 致 。 而 有 损 压 缩 ， 在 压缩 时 为 了 实现 更 大 程度 的 压 
缩 而 删除 了 某 些 数据 信息 ， 有 损 压 缩 文件 还 原 时 ， 与 原文 件 并 不 是 完全 吻合 ， 
但 是 与 原文 件 差别 并 不 大 。JPEG (图 像 压 缩 技术 〉 和 MP3 音频 压缩 技术 〉 技 
术 是 典型 的 有 损 压 缩 实 例 。 下 面 的 讨论 中 ， 仅 仅 涉及 无 损 压 缩 ， 因 为 计算 机 上 
的 大 多 数 数据 无 法 容忍 任何 数据 损失 。 


18.1.1 ”gzip 一 一 文件 压缩 与 解压 缩 


gzip 命令 用 于 压缩 一 个 或 更 多 文件 。 执 行 命令 后 ， 原 文件 会 被 其 压缩 文件 
取代 。 与 之 相反 ，gunzip 命令 则 将 压缩 文件 还 原 为 原文 件 。 示 例如 下 。 


Ime@linuxbox ~]$ 1s -1 /etc > foo.txt 

[me@linuxbox ~]$ ls -1 foo.* 

-PW-r--r-- 1 me me 15738 2012-10-14 07:15 foo.txt 
[me@linuxbox ~]$ gzip foo.txt 

[me@linuxbox ~]$ 1s -1 foo.* 

-FWw-r--r-- 1 me me 3230 2012-10-14 07:15 foo.txt.gz 
{me@linuxbox ~]$ gunzip foo .txt 

[me@linuxbox ~]$ 1s -1 foo.* 

-MW-r--r-- 1 me me 15738 2012-10-14 07:15 foo.txt 
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面 本 例 中 ， 我 们 首先 创建 了 一 个 名 为 foo.txt 的 文本 文件 ， 其 内 容 为 某 目 录 
所 含 文件 的 列表 清单 ， 然 后 运行 gzip 命令 。 于 是 ， 压 缩 后 的 文件 foo.txt.gz 便 取 
代 了 原文 件 。foo.* 表 达 式 的 文件 ， 我 们 可 以 看 到 原文 件 已 被 其 压缩 文件 取代 ， 
并 且 压 缩 后 的 文件 大 小 差不多 才 是 原文 件 的 1/5。 此 外 ， ee 压缩 
后 的 文件 与 原文 件 有 着 相同 的 权限 和 时 间 戳 。 

接着 ， 我 们 运用 gunzip 命令 进行 解压 缩 ， 如 此 该 压缩 文件 又 被 原始 文件 取 
代 ， 而 且 权 限 和 时 间 戳 仍然 保持 一 致 。 


gzip 有 许多 选项 ， 表 18-1 列 出 了 一 些 。 
表 18-1 gzip 的 选项 


选项 功能 描述 

-C 将 输出 内 容 写 到 标准 输出 端口 并 且 保 持原 有 文件 。 也 可 以 用 
--stdout 或 是 --to-stdout 替代 

-d 解压 缩 。 加 上 此 选项 ，gzip 命令 便 类 似 于 gunzip。 也 可 以 用 
--decompress 或 --uncompress 替代 

-f 强制 压缩 , 即便 原文 件 的 压缩 版 本 已 经 存在 了 。 也 可 以 用 --force 

-h 显示 有 用 信息 。 也 可 以 用 --help 代替 

-1 列 出 所 有 压缩 文件 的 压缩 统计 。 也 可 以 用 --list 代替 

-I 如 果 该 命令 行 的 操作 参数 中 有 一 个 或 是 多 个 是 目录 ， 那 么 递归 压 


缩 包 含 在 目录 中 的 文件 。 也 可 以 用 -recursive 代替 
-t 检验 压缩 文件 的 完整 性 。 也 可 以 用 --test 代替 


-v 在 压缩 时 显示 详细 信息 。 也 可 以 用 --verbose 代替 
-number 设 定 压缩 级 别 。number 是 1 (速度 最 快 ， 压 缩 比 最 小 ) ~9〈 速 度 


最 慢 ， 压 缩 比 最 大 ) 范围 中 的 一 个 整数 。 当 然 1~9 的 数值 亦 可 以 
分 别 描述 为 --fast 和 --best。gzip 默认 的 压缩 级 别 是 6 


回顾 前 面 的 例子 


[me@linuxbox -]$ gzip foo.txt 
[me@linuxbox ~]$ gzip -tv foo.txt.gz 
foo.txt .gz: OK 

[me@linuxbox ~]$ gzip -d foo.txt.gz 


此 例 中 ， 首 先 ， 我 们 将 压缩 文件 foo.txt.gz 取代 了 原文 件 foo.txt。 接 着 ， 我 
们 运用 -t、-v 选项 检查 压缩 文件 的 完整 性 。 最 后 ， 解 压缩 该 文件 为 原来 的 形式 。 


漠 助 标准 输入 输出 ，gzip 有 很 多 有 趣 的 用 法 。 
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注意 


[me@linuxbox ~]$ ls -1 /etc | gzip > foo.txt.gz 

此 命令 创建 了 一 个 目录 列表 的 压缩 版 本 。 

gunzip 命令 用 于 解压 gzip 的 压缩 文件 ， 并 且 默 认 解压 缩 后 缀 为 “.gz” 的 文 
件 ， 所 以 ， 我 们 没有 必要 明确 指定 ， 只 要 指定 名 与 已 存在 的 非 压 缩 文件 名 不 冲 
突 就 可 以 了 。 
[me@linuxbox ~]$ gunzip ?oo.txt 

如 果 只 是 希望 查看 某 个 压缩 文本 文件 的 内 容 ， 可 以 直接 输入 下 面 的 命 
令 行 : 
[me@linuxbox -]$ gunzip -c foo.txt | less 

或 者 ， 利 用 zcat 命令 联合 gzip 一 起 ， 其 效果 等 同 于 带 有 -c 选项 的 gunzip。 
zcat 的 功能 与 cat 命令 相同 ， 只 是 它 的 操作 对 象 是 压缩 文件 。 用 zcat 命令 处 理 
gzip 压缩 文件 的 示例 如 下 。 


[meelinuxbox ~]$ zcat foo.txt.gz | less 


同样 也 有 zless 命令 ， 它 与 前 面 所 讲 的 less 的 管道 功能 相同 。 


18.1.2 ”bzip2 一 一 牺牲 速度 以 换取 高 质量 的 数据 压缩 


bzip2 程序 由 Julian Seward 开发 ， 与 gzip 命令 功能 相仿 ， 但 使 用 不 同 的 压 
缩 算法 。 该 算法 具有 高 质量 的 数据 压缩 能 力 ， 但 却 降低 了 压缩 速度 。 多 数 情况 
下 ， 其 用 法 与 gzip 类 似 ， 只 是 用 bzip2 压缩 后 的 文件 以 .bz2 为 后 级 。 
[me@linuxbox ~]$ 1s -1 /etc > foo.txt 
[me@linuxbox ~]$ 1s -1 foo.txt 
-rw-r--r-- 1 me me 15738 2012-10-17 13:51 foo.txt 
[me@linuxbox -]$ bzip2 foo.txt 
[me@linuxbox ~]$ ls -1 foo.txt.bz2 


-rw-r--r-- 1 me me 2792 2012-10-17 13:51 foo.txt.bz2 
[me@linuxbox ~]$ bunzip2 foo.txt.bz2 


由 此 例 可 以 看 出 ，bzip2 用 法 与 gzip 类 似 ， 前 面 所 讨论 的 gzip 的 所 有 选项 
(除了 -fr 选项), bzip2 都 支持 。 然 而, 要 注意 的 是 , 两 者 的 压缩 级 别 选 项 (-number) 
有 些许 不 同 。 与 此 同时 ， 解 压缩 bzip2 压缩 文件 的 专用 工具 是 bunzip2 和 bzcat 
命令 。 


bzip2 还 配 有 专门 的 bzip2recover 命令 ， 该 命令 用 于 恢复 损坏 的 .bz2 文件 。 
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不 要 强制 压缩 

有 了 时， 笔者 看 到 有 人 试图 压缩 已 经 用 有 效 压缩 算法 压缩 过 的 文件 ， 他 们 
通常 会 这 么 做 。 
$ gzip picture.jpg 

不 可 以 这 么 做 ， 这 只 是 在 浪费 时 间 和 空间 而 已 ! 如 果 对 一 个 已 压缩 文件 
再 次 进行 压缩 ， 实 际 上 只 会 导致 文件 变 大 。 因 为 所 有 的 压缩 技术 会 在 压缩 文 
件 前 首先 增加 一 些 开 销 ， 以 描述 本 次 压缩 。 如 果 试 图 压缩 一 个 已 无 元 余 信息 
的 文件 ， 那 么 此 次 压缩 不 会 腾 出 任何 空间 来 抵消 增加 的 开销 。 


18.2 ”文件 归档 


”归档 是 与 压缩 操作 配合 使 用 的 一 个 常用 文件 管理 任务 。 归 档 是 一 个 聚集 众 
多 文件 并 将 它们 组 合 为 一 个 大 文件 的 过 程 ， 它 通常 作为 系统 备份 的 一 部 分 ， 而 
且 通 常 也 用 于 将 旧 数 据 从 某 个 系统 移 到 某 些 长 期 存储 设备 的 情况 下 。 


18.2.1 tar 一 一 磁带 归档 工具 


tar 命令 是 类 UNIX 系统 中 用 于 归档 文件 的 经 典 工 具 。tar 是 tape archive 的 缩写 ， 
由 此 可 见 ， 该 命令 最 初始 的 作用 就 是 磁带 备份 。 虽 然 该 命令 仍 可 用 于 传统 的 磁带 备 
份 ， 但 同样 也 可 用 于 其 他 存储 设备 。 大 家 肯定 经 常 看 到 文件 名 以 -tar 和 .tgz 结尾 的 文 
件 ， 它 们 分 别 是 用 普通 的 tar 命令 归档 的 文件 和 用 gzip 归档 的 文件 。tar 归档 文件 可 
以 由 许多 独立 的 文件 、 一 个 或 多 个 目录 层次 或 者 两 者 的 混合 组 合 而 成 ， 其 用 法 如 下 。 


tar mode[options] pathname... 


其 中 的 mode 是 指 表 18-2 中 此 列表 只 列 出 了 部 分 模式 ， 想 获得 全 部 信息 
可 以 查看 tar 的 man 手册 页 ) 列 出 的 操作 模式 的 一 种 。 


表 18-2 tar 命令 的 操作 模式 


模式 描述 

c 创建 文件 和 /或 目录 列表 的 归档 文件 
x 从 归档 文件 中 提取 文件 

t 在 归档 文件 末尾 追加 指定 路 径 名 

r 列 出 归档 文件 的 内 容 
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tar 命令 在 选项 的 表达 方式 上 有 点 奇怪 ， 所 以 ， 我 们 需要 举 一 些 例 子 以 说 明 
其 是 如 何 工 作 的 。 首 先 ， 重 新 创建 一 个 上 一 章 中 所 建 的 playground 文件 夹 。 


[meelinuxbox ~]$ mkdir -p playground/dir-{00{1..9},0{10..99},100} 
[meelinuxbox ~]$ touch playground/dir-{00{1..9},0{10..99},100} /file-{A..Z} 


下 面 ， 用 tar 命令 为 整个 playground 文件 夹 创建 一 个 归档 文件 。 


[meelinuxbox ~]$ tar cf playground.tar playground 


该 命令 行 创 建 了 一 个 叫做 playground.tar 的 tar 归档 文件 ， 该 归档 文件 包含 
了 playground 文件 夹 的 整个 目录 结构 。 从 命令 行 中 我 们 可 以 看 到 ，tar 命令 的 操 
作 模 式 ce 参数 和 用 于 指定 归档 文件 名 的 f 参 数 可 以 直接 连 着 写 在 一 起 而 中 间 不 需 
要 连 字 符 隔 开 。 然 而 ， 请 注意 ，mode 参数 必须 在 任何 选项 之 前 指定 。 


下 面 的 命令 行 用 于 列 出 归档 文件 的 内 容 ， 可 以 用 于 查看 已 经 备份 了 哪些 
文件 。 


[me@linuxbox ~]$ tar tf playground.tar 
如 若 想 获取 更 详细 的 信息 ， 可 以 增加 -v《 详 细 信息 ) 选项 。 


[me@linuxbox ~]$ tar tvf playground.tar 


现在 ， 将 playground 文件 夹 中 的 内 容 提取 到 一 个 新 的 位 置 。 首 先 ， 创 建 一 
个 名 为 foo 的 新 文件 夹 ， 然 后 切换 工作 目录 ， 再 提取 该 归档 文件 。 
[me@linuxbox ~]$ mkdir foo 
[me@linuxbox ~]$ cd foo 
[me@linuxbox foo]$ tar xf ../playground.tar 


[me@linuxbox foo]$ 1s 
playground 


查看 ~/foo/playground 目录 下 的 内 容 ， 便 会 发 现 该 归档 文件 已 经 成 功 提取 ， 
并 且 是 原文 件 的 精确 复制 。 但 是 存在 一 个 问题 ， 除 非 是 以 超级 用 户 的 名 义 执行 
该 命令 ， 不 然 ， 从 归档 文件 中 提取 出 来 的 文件 和 目录 的 所 有 权 属 于 执行 归档 操 
作 的 用 户 而 不 是 文件 的 原始 作者 。 


tar 命令 处 理 档 案 文件 路 径 名 的 方式 也 很 有 趣 ， 其 默认 的 路 径 名 是 相对 路 径 
而 不 是 绝对 路 径 ，tar 命令 创建 归档 文件 时 会 简单 地 通过 移 除 路 径 名 前 面 的 斜 杠 
来 实现 相对 路 径 。 作 为 演示 ， 下 面 会 重新 创建 一 个 归档 文件 ， 此 次 明确 指定 
一 个 绝对 路 径 。 


[me@linuxbox fool$ cd 
[me@linuxbox ~]$ tar cf playground2.tar ~/playground 


第 18 章 ”归档 和 备份 203 


记 住 ， 当 按 下 Enter 键 时 ， 上 面 命令 行 中 输入 的 目录 ~/playground 会 扩展 为 
/home/me/playground， 也 就 是 绝对 路 径 。 接 下 来 ， 我 们 按照 前 面 的 步骤 从 归档 
文件 中 提取 文件 ， 注 意 观 察 所 发 生 的 变化 。 

{me@linuxbox ~]$ cd foo 

[me@linuxbox foo]$ tar xf ../playground2.tar 
[me@linuxbox foo]$ 18 

home playground 

[me@linuxbox foo]$ ls home 


[meelinuxbox foo]$ 1s home/me 
playground 


此 刻 ， 我 们 便 会 发 现 当 解压 第 二 个 归档 文件 时 ， 在 当前 工作 目录 ~/foo 下 重 
新 创建 了 一 个 home/me/playground 目录 ， 而 不 是 在 认定 的 绝对 路 径 根 目录 下 创 
建 的 。 这 样 的 工作 方式 看 起 来 很 奇怪 ， 但 是 却 更 有 用 ， 因 为 如 此 可 以 将 归档 文 
件 解 压缩 到 任何 目录 下 而 不 用 被 迫 解压 到 原 目 录 下 ， 使 用 -v 选项 重复 操作 此 实 
例 可 以 详细 地 了 解 其 运行 情况 。 

下 面 让 我 们 看 一 个 假想 的 但 很 实用 的 tar 命令 应 用 实例 。 假设 我 们 需要 将 一 
个 系统 上 的 主 目录 及 其 内 容 复制 到 另外 一 个 系统 上 ， 并 且 具 备用 于 实现 这 一 转 
移 过 程 的 USB 大 硬盘 。 在 现代 Linux 系统 中 ， 此 硬盘 会 自动 挂 载 到 /media 目录 
下 。 再 假设 USB 硬盘 连接 系统 后 ， 设 备 名 为 BigDisk。 接 着 用 tar 进行 文件 归 
档 ， 示 例如 下 。 


[me@linuxbox ~]$ sudo tar cf /media/BigDisk/home.tar /home 


tar 归档 的 文件 写 入 硬盘 后 ， 我 们 将 硬盘 卸载 ， 再 将 其 与 另外 一 台 计 算 机 连 
接 。 同样 , 此 硬盘 挂 载 在 了 /media/BigDisk 目录 下 。 那么 如 何 解 压缩 该 归档 文件 ， 
示例 如 下 。 


[me@linuxbox2 ~]$ cd / 
[me@linuxbox2 /]$ sudo tar xf /media/BigDisk/home.tar 


这 里 需要 重点 注意 的 是 ， 我 们 首先 要 将 工作 目录 改 为 根 目录 ， 以 便 文 件 解 
压缩 在 根 目录 下 ， 因 为 归档 文件 中 的 所 有 文件 采用 的 都 是 相对 路 径 。 

当 从 归档 文件 中 提取 文件 时 ， 可 以 限制 只 提取 某 些 文件 。 例 如 ， 如 果 希 望 
从 归档 文件 中 只 提取 单个 文件 ， 可 以 用 如 下 命令 行 。 
tar xf archive.tar pathname 


在 命令 后 面 添加 要 提取 的 文件 的 路 径 名 ， 可 以 确保 tar 只 恢复 指定 文件 , 而 
且 可 以 指定 多 个 路 径 名 。 注 意 ， 指 定 的 路 径 名 必须 是 存储 在 归档 文件 中 的 完整 、 
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准确 的 相对 路 径 。 在 指定 路 径 名 时 ,通常 不 支持 通配符 。 但 是 ，GNU 版 本 的 tar 
命令 (在 Linux 发 行 版 本 中 该 版 本 的 tar 最 常见 ) 通过 使 用 --wildcards 选项 而 支 
持 通配符 。 下 面 就 是 一 个 利用 前 面 的 playground.tar 归档 文件 实践 通配符 的 例子 。 
[meelinuxbox ~]$ cd foo 


Ime@linuxbox foo]$ tar xf ../playground2.tar --wildcards ‘home/ne/playground/ 
dir-*/file-A’ 


此 命令 行 只 会 提取 那些 路 径 名 与 通配符 dir-* 匹 配 的 文件 。 


tar 命令 创建 归档 文件 时 通常 辅助 以 find 命令 。 首先 使 用 find 命令 查找 到 需 
要 被 归档 的 文件 ， 然 后 使 用 tar 对 这 些 文件 进行 归档 ， 实 例如 下 。 
[meelinuxbox ~]$ find playground -name 'file-A' -exec tar rf playground .tar '{ 
}' + 

上 例 ， 使 用 find 命令 匹配 playground 文件 夹 中 叫做 file-A 的 文件 ， 然 
后 借助 -exec 操作 选项 ， 启 动 tar 的 附加 模式 r 将 匹配 文件 添加 到 归档 文件 
playground.tar 中 。 


tar 命令 结合 find 命令 很 适合 创建 目录 树 以 及 整个 系统 的 增 量 备份 ， 使 用 find 
命令 找到 那些 在 时 间 惟 文件 之 后 创建 的 文件 ， 便 可 以 创建 一 份 只 包含 上 一 次 归 
档 之 后 创建 的 文件 的 归档 文件 ， 当 然 假定 该 时 间 戳 文件 是 在 每 一 个 归档 文件 创 
建 之 后 就 立刻 更 新 。 


tar 命令 还 可 以 利用 标准 输入 输出 。 下 面 就 是 一 个 综合 例子 。 


[me@linuxbox foo]$ cd 
[meelinuxbox ~]$ find playground -name 'file-A' | tar cf - --files-from=- | gzip 
> playground.tgz 


本 例 中 ， 先 用 find 命令 搜索 得 到 匹配 文件 列表 ， 然 后 将 匹配 文件 再 送 至 tar 
命令 处 理 。 如 果 文 件 名 前 面 明 确 指定 有 连 字 符 “-”， 那 就 意味 着 这 是 标准 输入 输 
出 的 文件 (顺便 讲 一 下 ， 使 用 “-” 代 表 标 准 “ 输 入 /输出 ”的 惯例 ， 其 他 许多 程 
序 也 都 采用 )。--files-from 选项 〈 也 可 以 简写 成 -T) 则 指定 了 tar 命令 从 文件 中 而 
不 是 从 命令 行 中 读 取 文 件 路 径 名 列表 。 最 后 ，tar 命令 归档 后 的 文件 再 送 至 gzip 
进行 压缩 , 由 此 得 到 压缩 归档 文件 Playground.tgz。 后 缀 -tegz 已 经 惯例 性 成 为 经 gzip 
压缩 的 tar 归档 文件 名 的 后 缀 ， 当 然 ， 我 们 有 时 也 用 .targz 作 后 缀 。 

虽然 可 以 从 外 部 使 用 gzip 命令 创建 压缩 归档 文件 ， 但 现代 GNU 版 本 的 tar 
命令 则 提供 gzip +z 选项 和 bzip2+j 选项 直接 实现 这 一 功能 。 以 前 面 的 例子 为 例 ， 
可 以 将 命令 行 简 化 为 以 下 命令 行 。 


第 18 章 ”归档 和 备份 205 


[meelinuxbox -~]$ find playground -name 'file-A'’ | tar czf playground.tgz -T - 
当然 ， 如 果 我 们 想 要 创建 一 个 bzip2 压缩 的 归档 文件 ， 可 以 这 么 做 。 
[me@linuxbox ~]$ find playground -name 'fTile-A' | tar cjf playground.tbz -T 一 


通过 简单 地 将 压缩 选项 从 z 变 为 j〈 并 将 输出 文件 后 缀 改 为 -tbz 以 显示 是 
bzip2 压缩 的 文件 )， 即 可 实现 bzip2 式 的 压缩 归档 文件 。 


利用 tar 命令 在 系统 之 间 传 输 网 络 文件 ， 是 tar 另外 一 个 利用 标准 输入 输出 
的 有 趣 用 法 。 假 设 ， 有 两 台 类 UNIX 系统 的 计算 机 正在 运行 ， 并 且 都 安装 了 tar 
命令 和 ssh 命令 ， 于 是 ， 我 们 便 可 以 将 远程 系统 〈 本 例 中 远程 系统 主机 名 叫做 
remote-sys) 中 的 某 目 录 转 移 到 本 地 系统 。 


[me@linuxbox ~]$ mkdir remote-Stuff 

[meelinuxbox ~]$ cd remote-stuff 

{me@linuxbox remote-stuff]$ ssh remote-sys 'tar cf - Documents' | tar xf - 
me@remote-sys’'s password: 

[me@linuxbox remote-stuff]$ 1s 

Documents 


上 例 中 ， 名 为 Documents 的 目录 从 remote-sys 的 远程 系统 复制 到 本 地 系 
统 上 的 remote-stu 企 的 文件 目录 里 。 这 是 如 何 实现 的 呢 ? 首先 ， 用 ssh 程序 在 
远程 系统 上 启动 tar 命令 , 此 时 可 能 会 联想 到 前 面 所 讲 的 ssh 具有 在 联网 机 器 
上 运行 远程 程序 并 将 结果 显示 在 本 地 系统 的 能 力 ， 也 就 是 远程 系统 的 标准 输 
出 送 至 本 地 系统 显示 。 于 是 ， 可 以 利用 这 一 特性 ， 我 们 可 以 将 tar 命令 创建 
的 归档 文件 (用 e 模式 创建 的 ) 送 至 标准 输出 而 不 是 直接 输出 文件 (-f 选 项 )， 
然后 通过 ssh 建立 的 加 密 隧 道 将 该 归档 文件 送 至 本 地 系统 。 在 本 地 系统 上 ， 
我 们 再 执行 tar 命令 提取 (x 模式 〉 标 准 输入 的 归档 文件 (同样 用 f 选 项 加 上 
连 字 符 作 为 参数 )。 


18.2.2 “zip 一 一 打包 压缩 文件 


zip 程序 既是 文件 压缩 工具 也 是 文件 归档 工具 。Windows 用 户 肯 定 很 熟悉 
这 种 文件 格式 ， 因 为 其 读 写 的 是 .zip 后 缀 的 文件 。 然 而 ，Linux 系统 中 ，gzip 才 
是 主要 的 压缩 指令 ， 而 bzip2 仅 次 之 。Linux 用 户主 要 使 用 zip 程序 与 Windows 
系统 交换 文件 ， 而 不 是 将 其 用 于 压缩 或 是 归档 文件 。 


zip 最 基本 的 调用 方式 如 下 。 
zip options zipfile file... 


例如 ， 创 建 一 个 playground 的 zip 归档 文件 ， 可 以 输入 下 面 的 命令 行 。 


206 Linux 命令 行 大 全 


[meelinuxbox ~]$ zip -r playground.zip playground 

此 例 中 ， 如 果 不 加 -r 选项 递归 的 话 ， 只 会 保留 playground 这 个 目录 而 不 包 
括 目 录 中 内 容 。 虽然 程序 会 自动 默认 添加 后 缀 .zip， 但 为 了 以 示 清 晰 ， 最 好 还 是 
在 命令 行 中 添加 文件 后 缀 。 


zip 归档 文件 创建 的 过 程 中 ，zip 通常 会 显示 如 下 的 一 系列 信息 。 


adding: playground/dir-020/file-Z (stored 0%) 
adding: playground/dir-020/file-Y (stored 0%) 
adding: playground/dir-020/file-X (stored 0%) 
adding: playground/dir-087/ (Stored 0%) 

adding: playground/dir-087/fTile-S (stored 0%) 


这 些 信息 显示 的 是 每 个 新 添 归 档 文件 的 状态 。zip 使 用 两 种 存储 方式 向 归档 
文件 中 添加 文件 。 第 一 ， 不 对 文件 进行 压缩 直接 存储 ， 如 本 例 ， 第 二 ， 缩 小 文 
件 大 小 ， 即 对 文件 进行 压缩 后 存储 。 紧 随 存储 方法 之 后 显示 的 数值 表示 的 是 实 
现 的 压缩 比 。 由 于 使 用 的 playground 文件 夹 是 空 文件 夹 ， 所 以 并 没有 对 其 内 容 
进行 压缩 。 


利用 unzip， 我 们 可 以 直接 提取 zip 文件 中 的 内 容 。 


[me@linuxbox ~]$ cd foo 
[meelinuxbox foo]$ unzip ../playground.zip 


关于 zip， 有 一 点 需要 注意 (与 tar 命令 相 比 )， 即 如 果 指定 的 归档 文件 已 经 
存在 , 那么 zip 仅仅 只 会 更 新 而 不 会 取而代之 。 这 意味 着 原来 存在 的 归档 文件 会 
保留 下 来 ， 只 是 增加 了 一 些 新 文件 ， 原 有 匹配 文件 则 被 替换 。 


通过 给 unzip 指定 提取 的 文件 名 , 我 们 可 以 选择 性 地 从 zip 归档 文件 中 提取 
文件 。 
[meelinuxbox ~]$ unzip -1 playground.zip playground/dir-087/file-z 
Archive: ./playground.zip 


Length Date Time Name 


[me@linuxbox ~]$ cd foo 

[me@linuxbox foo]$ unzip ../playground.zip playground/dir-087/file-Z 
Archive: ../playground.zip 

replace playground/dir-087/file-z? [y]Jes, In]o, [A]1l, [Njone, [rjename: y 
extracting: playground/dir-087/file-Zz 


使 用 -1 选项 ，unzip 只 会 列 出 归档 文件 的 内 容 而 不 会 从 中 提取 文件 。 如 果 没 
有 指定 任何 文件 ，unzip 将 会 提取 归档 文件 中 的 所 有 文件 ， 我们 可 以 增加 -v 选项 
得 到 更 详细 的 列表 。 注 意 当 提取 的 文件 与 已 存在 文件 冲突 时 ， 原 文件 被 取代 之 
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前 会 提示 用 户 是 否 执行 此 替换 操作 。 


与 tar 命令 类 似 ，zip 命令 也 可 以 利用 标准 输入 输出 ， 尽 管 此 用 法 在 某 种 程 
度 上 来 说 作用 并 不 大 。 我 们 也 可 以 用 -@ 选 项 将 多 个 文件 送 至 zip 进行 压缩 。 


Ime@linuxbox foo]$ cd 
[me@linuxbox ~]$ find playground -name "file-A" | zip -@ file-A.zip 


本 例 中 ， 我 们 利用 find 命令 产生 一 个 匹配 -name 项 的 “file-A” 文 件 列表 ， 
然后 将 结果 直接 作为 zip 命令 的 输入 , 从 而 得 到 了 一 个 包含 选 定 文件 的 归档 文件 
file-A.zip。 

zip 同样 可 以 将 结果 送 至 标准 输出 ， 但 是 由 于 只 有 极 少 的 命令 能 够 利用 其 输 
出 结果 ， 所 以 这 种 用 法 具有 局 限 性 。 不 幸 的 是 ，unzip 程序 不 支持 标准 输入 ， 所 
以 zip 和 unzip 不 能 像 tar 命令 一 样 一 起 用 于 处 理 网 络 文件 。 

然而 ，zip 命令 支持 标准 输入 ， 所 以 可 以 用 于 压缩 其 他 程序 的 输出 结果 。 


[me@linuxbox ~]$ 1s -1 /etc/ | zip ls-etc.zip - 
adding: - (deflated 80%) 


本 例 中 ,我们 将 ls 的 输出 结果 列表 直接 送 给 zip。 与 tar 命令 一 样 ，zip 会 默 
认 末 尾 的 连 字 符 代表 输入 的 文件 是 标准 输入 。 


当 指 定 -p 选项 后 ，unzip 命令 便 将 其 输出 结果 以 标准 形式 输出 。 
[meelinuxbox ~]$ unzip -p ls-etc.zip | less 


到 目前 为 止 ， 本章 只 涉及 了 zip 和 unzip 命令 的 一 些 基 本 用 法 ， 它 们 其 实 还 
有 很 多 选项 ， 尽 管 有 些 只 适用 于 其 他 系统 的 特定 平台 ， 但 是 它们 使 用 起 来 很 灵 
活 。zip 和 unzip 的 man 手册 页 都 很 全 面 ， 且 包含 了 很 多 有 用 的 例子 。 


18.3 同步 文件 和 目录 


将 一 个 或 多 个 目录 与 本 地 系统 〈 通 常 是 某 种 可 移动 存储 设备 ) 或 是 远程 系 
统 上 其 他 的 目录 保持 同步 ， 是 维护 系统 备份 文件 的 常用 方法 。 例 如 ， 本 地 系统 
上 有 一 个 正在 开发 的 网 站 备份 ， 用 户 通常 会 在 远程 Web 服务 器 上 进行 “实时 ” 
备份 以 实现 同步 更 新 。 


18.3.1 rsync 一 一 远程 文件 、 目 录 的 同步 
针对 类 UNIX 系统 ， 完 成 这 一 同步 任务 最 合适 的 工具 当 属 rsync。 该 命令 通 
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过 运用 rsync 远程 更 新 协议 , 同步 本 地 系统 与 远程 系统 上 的 目录 , 该 协议 允许 rsync 
命令 快速 检测 到 本 地 和 远程 系统 上 两 个 目录 之 间 的 不 同 ， 从 而 以 最 少数 量 的 复 
制 动 作 以 完成 两 个 目录 之 间 的 同步 。 因 此 ，rsync 命令 与 其 他 复制 命令 相 比 ， 显 
得 既 快 又 经 济 。 

rsync 命令 调用 方式 如 下 。 
rsync options source destination 


这 里 的 source 和 destination 是 下 列 选 项 之 一 : 
。 一 个 本 地 文件 或 目录 ; 
。 一 个 远程 文件 或 目录 ， 形 式 为 [user@]host:path; 
。 一 个 远程 rsyne 服务 器 ， 由 rsync://[user@]host[:port]/path 指定 。 
请 注意 ，source 和 destination 中 必须 有 一 个 本 地 文件 ， 因 为 rsync 不 支持 远 
程 系统 与 远程 系统 之 间 的 复制 。 
我 们 在 本 地 文件 上 实践 rsync 命令 ， 首 先 应 清空 foo 目录 。 
[me@linuxbox -]$ rm -rf foo/* 
接着 ， 同 步 playground 目录 和 它 在 foo 目录 中 的 相应 副本 : 
[meelinuxbox ~]$ rsync -av playground foo 


此 命令 行 中 ， 我 们 运用 了 -a 用 于 归档 一 一 进行 递归 归档 并 保留 文件 属性 ) 
选项 和 -v (详细 输出 ) 选项 在 foo 目录 中 生成 了 playground 目录 的 镜像 备份 。 此 
命令 行 运行 过 程 中 ， 我 们 会 看 到 一 系列 文件 和 目录 被 复制 。 最 后 ， 显 示 如 下 的 
汇总 信息 ， 表 示 文 件 复制 的 总 量 。 


sent 135759 bytes received 57870 bytes 387258.00 bytes/sec 
total size is 3230 speedup is 0.02 


再 次 运行 该 命令 行 ， 会 得 到 不 同 的 结果 。 
[me@linuxbox ~]$ rsync -av playgound foo 
building file list ... done 


sent 22635 bytes received 20 bytes 45310.00 bytes/sec 
total size is 3230 speedup is 0.14 


请 注意 ， 此 时 并 不 会 列 出 文件 列表 。 因 为 rsync 目录 检测 出 ~/playground 和 
~/foo/playground 两 个 文件 夹 之 间 并 没有 区 别 ， 因 此 不 需要 进行 任何 复制 操作 。 
如 果 playground 目录 中 的 某 个 文件 被 修改 了 , 那么 rsync 会 检测 到 该 变化 并 且 只 
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复制 这 个 刚刚 更 新 的 文件 。 


[meelinuxbox ~]$ touch plLayground/dir-099/fjile-Z 
[meelinuxbox ~]$ rsync -av Playground foo 

building file list ... done 

playground/dir-099/file-Zz 

sent 22685 bytes received 42 bytes 45454.00 bytes/sec 
total size is 3230 speedup is 0.14 


下 面 举 一 个 实际 的 例子 ， 回 想 前 面 讲解 tar 命令 时 所 举 的 虚拟 外 部 硬盘 的 例 
子 。 当 该 设备 与 系统 连接 时 ， 再 次 挂 载 在 /media/BigDisk 目录 下 ， 就 可 以 进行 系 
统 备份 了 。 首 先 ， 我 们 在 外 部 硬盘 上 创建 一 个 /backup 的 目录 ， 然 后 使 用 rsync 
命令 将 系统 中 最 重要 的 内 容 复 制 到 该 外 部 设备 。 
[meelinuxbox ~]$ mkdir /media/BigDisk/backup 


[me@linuxbox ~]$ sudo rsync -av --delete /etc /home /usr/local /media/BigDisk/ 
backup 


在 本 例 中 ， 系 统 中 的 /etc、/home 和 /usr/local 目录 成 功 备份 到 了 虚拟 存储 设 
备 中 ， 同 时 添加 了 -delete 选项 以 移 除 那些 残留 于 备份 设备 中 而 源 设备 中 已 经 不 
存在 的 文件 “这 一 步骤 在 第 一 次 备份 时 无 关 紧要 ， 但 在 后 续 的 复制 操作 中 会 起 
作用 )。 重 复 插入 该 外 围 设 备 并 运行 rsync 命令 ， 对 于 小 型 系统 来 说 ， 这 是 一 
个 持续 备份 的 好 (虽然 不 是 完美 的 ) 方法 。 当 然 ， 如 果 此 处 使 用 别名 会 更 方 
便 。 于 是 ， 我 们 可 以 定义 一 个 别名 ， 并 将 其 添加 到 .bashrc 文件 中 ， 以 提供 该 
备份 功能 。 


alias backup='sudo rsync -av --delete /etc /home /usr/local /media/BigDisk/backup’ 


现在 所 要 做 的 就 是 插入 外 围 设备 ， 运 行 别名 backup 即 可 完成 上 述 备份 操作 。 


18.3.2 在 网 络 上 使 用 rsync 命令 


通过 网 络 复制 文件 是 rsync 用 法 的 另 一 个 美妙 之 处 。 毕 竟 ，rsync 命令 名 中 的 
r 其 实 指 的 是 remote 〈 远 程 )。 远 程 复制 可 以 由 以 下 两 种 方法 中 的 任 一 种 实现 。 


方法 之 一 是 针对 于 已 安装 了 rsynec 命令 以 及 诸如 ssh 等 远程 shell 程序 的 系 
统 。 假 定 本 地 网 络 有 另外 一 个 具有 足够 可 利用 硬盘 空间 的 系统 ， 同 时 希望 利用 
远程 系统 而 非 外 部 设备 进行 备份 操作 。 假 使 远程 系统 已 经 有 一 个 用 于 存放 备份 
文件 的 /backup 目录 ， 那 么 我 们 便 可 以 直接 运行 下 面 的 命令 。 


[me@linuxbox ~]$ sudo rsync -av --delete --rsh=ssh /etc /home /usr/local remote- 
sys: /backup 


此 处 命令 行 改动 了 两 个 地 方 。 第 一 , 增加 了 --rsh=ssh 选项 ， 该 选项 告诉 rsync 
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使 用 ssh 命令 作为 其 远程 shell 命令 。 只 有 这 样 ， 我 们 才 可 以 通过 SSH 的 加 密 隧 
道 安全 地 从 本 地 系统 向 远程 主机 传输 数据 。 第 二 ， 在 destination 路 径 名 前 指定 
了 远程 主机 名 《本 例 中 的 远程 主机 名 是 remote-sys)。 


方法 之 二 ， 使 用 rsync 服务 器 同步 网 络 文 件 ， 通 过 配置 rsync 运行 一 个 守护 进 
程 监听 进来 的 同步 请 求 。 这 种 方法 通常 用 于 远程 系统 的 镜像 备份 , 例如, Red Hat 
软件 为 发 行 其 Fedora 系统 ， 需 要 维持 一 个 正在 开发 的 大 的 软件 包 库 。 对 于 软件 
测试 员 来 说 , 在 发 行 版 的 测试 阶段 创建 这 个 大 和 集合 的 备份 是 很 重要 的 ， 因为 库 
中 的 文件 会 频繁 变动 〈 每 天 会 有 多 次 改动 )， 所 以 通过 周期 性 的 同步 来 维持 本 
地 文件 镜像 要 比 批 量 复制 软件 库 更 可 取 。Georgia Tech 就 维护 了 其 中 一 个 库 ， 可 
以 使 用 本 地 复制 工具 rsync 以 及 Georgia Tech 的 rsync 服务 器 来 创建 该 库 的 镜 
像 备份 。 
[me@linuxbox ~]$ mkdir fedora-devel 


[me@linuxbox ~]$ rsync -av -delete rsync://rsync.gtlib.gatech.edu/fedora- 
linux-core/development/i386/0s fedora-devel 


本 例 中 ， 使 用 rsync 远程 服务 的 URI 是 由 协议 (rsync:W/)、 远 程 主机 名 
(rsync.gtlib.gatech.edu) 和 库 的 路 径 名 组 成 。 


*19s 


正则 表达 式 


在 下 面 几 章 ， 我 们 会 讨论 一 些 用 于 文本 操作 的 工具 。 我 们 已 经 知道 ， 文 本 
数据 在 类 UNIX 系统 中 (比如 Linux) 扮演 着 非常 重要 的 角色 。 但 是 ， 在 领略 这 
些 工具 强大 的 功能 前 ， 我 们 还 是 先 看 一 下 经 常 与 这 些 工 具 的 复杂 用 法 相关 联 的 
技术 一 一 正则 表达 式 。 


前 面 我 们 已 经 接触 过 命令 行 提供 的 许多 特性 和 工具 ， 并 且 也 遇 到 过 一 些 相 
当 神 秘 的 shell 特性 及 命令 , 比如 shell 扩展 和 引用 、 键 盘 快 捷 键 和 命令 历史 记录 
等 ， 更 不 用 提 vi 编辑 器 了 。 正 则 表达 式 也 延续 了 这 种 传统 ， 而 且 可 以 说 是 众多 
特性 中 最 神秘 的 一 个 〈 该 说 法 应 该 会 持 有 争议 )。 当 然 ， 并 不 是 说 这 些 特性 不 值 
得 大 家 人 花 时 间 去 学 习 。 恰 恰 相 反 ， 熟 练 掌握 这 些 用 法 会 给 人 意 想 不 到 的 效果 ， 
尽管 它们 的 全 部 价值 可 能 不 会 立即 体现 出 来 。 


19.1 和 什么 是 正则 表达 式 
简单 地 说 ， 正 则 表达 式 是 一 种 符号 表示 法 ， 用 于 识别 文本 模式 。 在 某 种 程 
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度 上 ， 它 们 类 似 于 匹配 文件 和 路 径 名 时 使 用 的 shell 通配符 ， 但 其 用 途 更 广泛 。 
许多 命令 行 工具 和 大 多 数 编程 语言 都 支持 正则 表达 式 ， 以 此 来 解决 文本 操作 方 
面 的 问题 。 然 而 ， 在 不 同 的 工具 ， 以 及 不 同 的 编程 语言 之 间 ， 正 则 表达 式 都 会 
略 有 不 同 ， 这 让 事情 进一步 麻烦 起 来 。 方 便 起 见 ， 我 们 将 正则 表达 式 的 讨论 限 
定 在 POSIX 标准 中 〔 它 涵盖 了 大 多 数 命 令 行 工具 )， 与 许多 编程 语言 (最 著名 
的 Perl) 不 同 ， 这 些 编程 语言 使 用 的 符号 集 要 更 多 一 些 。 


19.2 grep 一 一 文本 搜索 


我 们 用 来 处 理 正则 表达 式 的 主要 程序 是 grep。grep 名 字源 于 “global regular 
expression print”， 由 此 也 可 以 看 到 ，grep 与 正则 表达 式 有 关 。 实 际 上 ，grep 搜索 
文本 文件 中 与 指定 正则 表达 式 匹 配 的 行 ， 并 将 结果 送 至 标准 输出 。 


目前 为 上 上， 我 们 我 们 已 经 利用 grep 搜索 了 固定 的 字符 串 ， 如 下 所 示 ， 
[meelinuxbox -]$ 1s /usr/bin | grep zip 

该 命令 行 的 作用 是 列 出 /usr/bin 目录 下 文件 名 包含 zip 字符 串 的 所 有 文件 。 

grep 程序 按照 如 下 方式 接受 选项 和 参数 。 


grep [options] regex {file...] 


其 中 字符 串 regex 代表 的 是 某 个 正则 表达 式 。 
表 19-1 列 出 了 grep 常用 的 选项 。 
表 19-1 grep 选项 
选项 功能 描述 
i 忽略 大 小 写 。 不 区 分 大 写 和 小 写字 符 ， 也 可 以 用 --ignore-case 指定 


不 匹配 。 正 常情 况 下 ，grep 会 输出 匹配 行 ， 而 该 选项 可 使 grep 输出 不 包含 匹配 项 的 所 有 
行 。 也 可 以 用 --invert-match 指定 


输出 匹配 项 数目 《如 果 有 -v 选项 ， 那 就 输出 不 匹配 项 的 数目 ) 而 不 是 直接 输出 匹配 行 自 
身 。 也 可 以 用 --count 指定 


输出 匹配 项 文件 名 而 不 是 直接 输出 匹配 行 自身 。 也 可 以 用 --files-with-matches 指定 

与 -1 选项 类 似 ， 但 输出 的 是 不 包含 匹配 项 的 文件 名 。 也 可 以 用 --files-without-match 指定 
-n 在 每 个 匹配 行 前 面 加 上 该 行 在 文件 内 的 行 号 。 也 可 以 用 --line-number 指定 
进行 多 文件 搜索 时 ， 抑 制 文件 名 输出 。 也 可 以 用 --no-fiiename 指定 


PE 


1 
-a 


为 了 更 为 全 面 地 了 解 grep， 我 们 创建 几 个 文本 文件 来 进行 搜索 。 
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[meelinuxbox ~]$ ls /bin > dirlist-bin.txt 

[me@linuxbox -]$ 1s /usr/bin > dirlist-usr-bin.txt 
[me@linuxbox ~]$ 18 /sbin > dirlist-sbin.txt 

[meelinuxbox ~]$ 1s /usr/sbin > dirlist-usr-sbin.txt 
[me@linuxbox ~]$ 1s dirlist*.txt 

dirlist-bin.txt dirlist-sbin.txt dirlist-usr-sbin.txt 
dirlist-usr-bin.txt 


我 们 可 以 对 文件 列表 执行 简单 搜索 ， 如 下 所 示 。 


[meelinuxbox ~]$ grep bzip dirlist:*.txt 
dirlist-bin.txt:bzip2 
dirlist-bin.txt:bzip2recover 


本 例 中 ，grep 命令 会 搜索 所 所 有 的 文件 ， 以 查找 字符 串 bzip， 并 找到 了 两 


个 匹配 项 , 而 且 这 两 个 匹配 项 都 在 文件 dirlist-bin.txt 里 。 如 果 我 们 只 对 包含 匹配 
项 的 文件 感 兴趣 而 不 是 对 匹配 项 本 身 感 兴趣 ， 可 以 指定 -1 选项 。 


[me@linuxbox ~]$ grep -1 bzip dirlist*.txt 
dirlist-bin.txt 


相反 ， 如 果 那 只 想 查 看 那些 不 包含 匹配 项 的 文件 ， 则 可 以 用 如 下 命令 行 。 


[me@linuxbox ~]$ grep -L bzip dirlist*,txt 
dirlist-sbin.txt 

dirlist-usr-bin.txt 

dirlist-usr-sbin.txt 


19.3 ”元 字符 和 文字 


虽然 看 起 来 不 是 很 明显 ， 但 grep 搜索 一 直 都 在 使 用 正则 表达 式 ， 尽 管 那些 
例子 都 很 简单 。 正则 表达 式 bzip 用 于 匹配 文本 中 至 少 包含 4 个 字符 、 存 在 连续 
的 按 b、z、\i\p 顺序 组 成 的 字符 串 的 行 。 字 符 串 bzip 中 的 字符 都 是 文字 字符 (literal 
character)， 即 它们 只 能 与 自身 进行 匹配 。 除 了 文字 字符 ， 正 则 表达 式 还 可 以 包 
含 用 于 指定 更 为 复杂 的 匹配 的 元 字符 。 正 则 表达 式 的 元 字符 包括 以 下 字符 。 
“$0]{t}-?7*+*+()|\ 

其 他 所 有 字符 则 被 当 作 文字 字符 ， 但 是 在 极 少 数 的 情况 下 ， 反 斜 杠 字 符 用 
来 创建 元 序列 ， 以 及 用 来 对 元 字符 进行 转 义 ， 使 其 成 为 文字 字符 ， 而 再 被 解释 
为 元 字符 。 


可 以 看 到 ， 当 shell 在 执行 扩展 时 ， 许 多 正则 表达 式 的 元 字符 在 shell 中 有 具 
有 特殊 的 含义 。 所以， 在 命令 行 中 输入 包含 元 字符 的 正则 表达 式 时 ， 应 把 这 些 
元 字符 用 引号 括 起 来 以 避免 不 必要 的 shell 扩展 。 
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19.4 任意 字符 


接 下 来 讨论 的 第 一 个 元 字符 是 “点 ”字符 或 者 句点 字符 ， 该 字符 用 于 匹配 
任意 字符 。 如 果 将 其 加 进 某 个 正则 表达 式 中 ， 它 将 会 在 对 应 位 置 匹配 任意 字符 。 
下 面 就 是 一 个 应 用 实例 。 


[me@linuxbox ~]$ grep -h '.zip’' dirlist*.txt 
bunzip2 
bzip2 
bzip2recover 
gunzip 

gzip 

funzip 
gpg-zip 
preunzip 
prezip 
prezip-bin 
unzip 
unzipsfx 


上 述 命令 行 ， 搜 索 到 了 所 有 匹配 正则 表达 式 .zip 的 命令 行 。 但 其 输出 结果 有 
一 些 有 趣 的 地 方 ， 比 如 说 输出 中 并 没有 包含 zip 程序 ， 这 是 因为 正则 表达 式 中 的 
“.” 元 字符 将 匹配 长 度 增 加 到 了 4 个 字符 。 而 “zip” 只 包含 了 3 个 字符 ， 所 以 不 
匹配 。 同 样 ， 如 果 列 表 中 某 个 文件 包含 了 文件 扩展 名 “.zip”， 那 么 该 文件 也 会 被 
认为 是 匹配 文件 ， 因 为 文件 扩展 名 中 的 “.” 符 号 也 被 当 作 “任意 字符 ”处 理 了 。 


19.5 锚 


插入 符 〈^) 和 美元 符号 〈$) 在 正则 表达 式 被 当做 锚 ， 也 就 是 说 正则 表达 
式 只 与 行 的 开头 〈^) 或 是 末尾 〈$) 的 内 容 进行 匹配 比较 。 


[me@linuxbox ~]1$ grep -h '“zip' dirlist*.txt 
zip 

zipcloak 

zipgrep 

zipinfo 

zipnote 

zipsplit 

[me@linuxbox ~]$ grep -h 'zip$' dirlist*.txt 
gunzip 

gzip 

funzip 

gpg-zip 

preunzip 

prezip 
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unzip 

zip 

[me@linuxbox ~]$ grep -h '^zip$' dirlist*.txt 
zip 


上 例 中 搜索 的 是 行 开头 、 行 末尾 都 有 字符 串 “zip”( 例 如 zip 自 成 一 行 ) 的 文 
件 。 请 注意 ， 正 则 表达 式 “^”( 行 开头 和 行 末尾 之 间 没有 字符 ) 将 会 匹配 空 行 。 


纵横 填 字 字谜 助手 
我 的 妻子 很 喜欢 玩 纵横 填 字 字 谜 这 个 游戏 ， 并 且 有 时 她 会 拿 一 个 具体 问 
题 向 我 寻求 帮助 。 诸 如 “有 一 个 5 个 字母 的 单词 ， 它 的 第 三 个 字母 是 j， 有 最 后 
一 个 字母 是 r， 请 问 这 是 什么 单词 ? ”等 等 ， 这 类 问题 不 得 不 让 我 思考 。 
你 们 知道 Linux 系统 本 身 自 带 一 个 字典 吗 ? 查 看 /Usr/share/dict 目录 , 就 
会 发 现 一 个 或 是 多 个 这 样 的 字典 . 字典 中 的 文件 包含 的 是 一 个 常常 的 单词 列 
表 ， 每 个 单词 占 一 行 ， 以 字母 表 的 顺序 排列 。 在 我 自己 的 系统 上 ， 单 词 文 件 
中 包含 了 超过 98,500 个 单词 。 可 以 输入 如 下 命令 行 ， 得 到 上 述 字谜 问题 的 
可 能 答案 : 
ee noo ~]$ grep -i '^..j.r$' /usr/share/dict/words 
ajor 
major 
利用 这 样 的 正则 表达 式 ， 便 可 以 找到 字典 中 所 有 匹配 的 单词 ， 即 满足 字 
符 长 度 为 5、 第 三 个 字母 是 j 以 及 末尾 字母 是 + 的 所 有 单词 。 


19.6 中 括号 表达 式 和 字符 类 


中 括号 除了 可 以 用 于 匹配 正则 表达 式 中 给 定位 置 的 任意 字符 外 ， 还 可 以 用 
于 匹配 指定 字符 集中 的 单个 字符 。 借 助 于 中 括号 ， 我 们 可 以 指定 要 匹配 的 字符 
集 (也 包括 那些 可 能 会 被 解释 为 元 字符 的 字符 )。 如 下 命令 行 则 利用 了 一 个 两 个 
字母 组 成 的 字符 集 ， 用 于 匹配 包含 bzip 或 gzip 字符 串 的 文本 行 。 
[me@linuxbox ~]$ grep -h '[bg]zip’' dirlist*.txt 
bzip2 
bzip2recover 
gzip 

一 个 字符 集 可 以 包含 任意 数目 的 字符 ， 并 且 当 元 字符 放置 到 中 括号 中 时 ， 
会 失去 它们 的 特殊 含义 。 然 而 ， 在 两 种 情况 下 ， 则 会 在 中 括号 中 使 用 元 字符 ， 
并 且 会 有 不 同 的 含义 。 第 一 个 就 是 插入 符 〈^)， 它 在 中 括号 内 使 用 表示 否定 ; 
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另外 一 个 是 连 字 符 〈-)， 它 表示 字符 范围 。 


19.6.1 否定 


如 果 中 括号 内 的 第 一 个 字符 是 插入 符 “^)， 那 么 剩 下 的 字符 则 被 当 作 不 应 
该 在 指定 位 置 出 现 的 字符 集 。 作 为 演示 ， 我 们 对 前 面 的 例子 稍 作 修 改 。 


[me@linuxbox -]$ grep -h '[^bg]zip' dirlist*.txt 
bunzip2 

gunzip 

funzip 

gpg-zip 

preunzip 

prezip 

prezip-bin 

unzip 

unzipsfx 


通过 使 用 否定 操作 ， 我 们 可 以 得 到 那些 包含 zip 字符 捉 但 zip 前 面 既 不 是 5 
也 不 是 g 的 所 有 程序 。 请 注意 ， 此 时 zp 命令 仍然 没有 出 现在 结果 列表 中 ， 由 此 
可 见 否 定 ， 字 符 集 仍然 需要 在 指定 位 置 有 对 应 字符 ， 只 不 过 这 个 字符 不 是 否定 
字符 集中 的 成 员 而 已 。 


插入 符号 “^” 只 有 是 中 括号 表达 式 中 的 第 一 个 字符 时 才 会 被 当 作 否 定 符 ， 
如 果 不 是 第 一 个 ,“^” 将 会 丧失 其 特殊 含义 而 成 为 普通 字符 。 


19.6.2 ”传统 字符 范围 


如 果 我 们 希望 建立 一 个 正则 表达 式 ， 用 于 查找 文件 名 以 大 写字 母 开头 的 文 
件 ， 可 以 用 下 面 的 命令 行 。 


[meelinuxbox -~]$ grep -h '“^[ABCDEFGHIJKLMNOPQRSTUVWXZY]' dirlist*.txt 


这 仅仅 是 将 26 个 大 写字 母 写 入 中 括号 的 小 事 ， 但 是 要 输入 26 个 字母 实在 
有 点 麻烦 ， 我 们 可 以 用 下 面 的 简单 方法 完成 。 


[me@linuxbox ~]$ grep -h '^[A-2]' dirlist*.txt 
MAKEDEV 

ControlPanel 

GET 

HEAD 

POST 

XxX 

X11 

Xorg 

MAKEFLOPPIES 
NetworkManager 
NetworkManagerDispatcher 
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通过 使 用 三 个 字符 表示 的 字符 范围 ， 我 们 可 以 缩写 这 26 个 字母 。 能 够 按照 
这 种 方式 表达 的 任何 字符 范围 可 以 包含 多 个 范围 ， 比 如 下 面 这 个 表达 式 可 以 匹 
配 以 字母 和 数字 开头 的 所 有 文件 名 。 


[meelinuxbox ~]$ grep -h '“^[A-Za-z0-9]' dirlist*.txt 


在 字符 范围 中 ， 可 以 看 到 连 字符 有 了 特殊 的 用 法 ， 那 么 如 何在 中 括号 中 真 
正 包括 一 个 连 字符 字符 ? 可 将 连 字符 作为 中 括号 内 的 第 一 个 字符 ， 示 例如 下 。 


[me@linuxbox ~]$ grep -h '[A-Z]’' dirlist*.txt 
此 命令 行 匹 配 的 是 文件 名 中 包含 一 个 大 写字 母 的 文件 。 而 下 面 的 命令 行 
[me@linuxbox ~]$ grep -h '[-AZ]' dirlist*.txt 


匹配 的 则 是 文件 名 包含 连 字符 、 大 写字 母 4 或 大 写字 和 母 Z 的 文件 。 


19.6.3 POSIX 字符 类 


传统 的 字符 范围 表示 方法 很 容易 理解 ， 而 且 能 够 有 效 、 快 速 地 指定 字符 集 。 
但 不 足 之 处 在 于 ， 它 并 不 是 所 有 情况 者 适用。 虽然 到 目前 为 止 ， 在 使 用 grep 命 
令 时 还 没有 遇 到 过 任何 问题 ， 但 是 在 其 他 程序 中 则 可 能 会 遇 到 问题 。 


在 第 4 章 ， 我 们 讨论 了 如 何 使 用 通配符 来 执行 路 径 名 扩展 。 在 该 讨论 中 我 
们 提 到 ， 字 符 范 围 的 用 法 几乎 与 其 在 正则 表达 式 中 一 致 ， 现 在 问题 出 现 了 。 


[me@linuxbox ~]$ 1s /usr/sbin/[ABCDEFGHIJKLMNOPQRSTUVWXYZ]* 
/usr/sbin/MAKEFLOPPIES 

/usr/sbin/NetworkManagerDispatcher 

/usr/sbin/NetworkManager 


Linux 发 行 版 本 不 同 ， 上 述 命令 行 得 到 的 结果 可 能 会 不 同 , 甚至 有 可 能 是 空 
列表 。 本 例 中 的 列表 来 自 于 Ubuntu 系统 。 该 命令 行 得 到 了 预期 效果 一 一 只 有 以 
大 写字 母 开头 的 文件 列表 。 但 是 ， 如 果 我 们 使 用 下 面 的 命令 行 ， 便 会 得 到 完全 
不 同 的 结果 《〈 只 显示 了 输出 结果 的 一 部 分 )。 


[meelinuxbox ~]$ ls /usr/sbin/[A-Z]* 
/usr/sbin/biosdecode 

/usr/sbin/chat 

/usr/sbin/chgpasswd 
/usr/sbin/chpasswd 

/usr/sbin/chroot 
/usr/sbin/cleanup-info 
/usr/sbin/complain 
/usr/sbin/console-kit-daemon 
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为 什么 会 出 现 这 样 的 差异 ? 说 来 话 长 ， 简 单 解释 如 下 。 


在 UNIX 开发 初期 ， 它 只 识别 ASCI 字符 ， 而 正 是 这 一 特性 导致 了 上 面 的 
差异 。 在 ASCII 码 中 ， 前 32 个 字符 (第 0~31 字符 ) 都 是 控制 字符 〈 像 Tab 键 、 
空格 键 以 及 Enter 键 等 )， 后 32 个 字符 (第 32~63) 包含 可 打印 字符 ， 包括 大 多 
数 的 标点 符号 以 及 数字 0~9， 接 下 来 的 32 个 (第 64~95) 包含 大 写字 母 和 一 些 
标点 符号 ， 最 后 的 31 个 (第 96~127) 则 包含 小 写字 母 以 及 更 多 的 标点 符号 。 基 
于 这 样 的 安排 ， 使 用 ASCII 的 系统 使 用 了 下 面 这 种 排序 : 


ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz 
这 与 通常 的 字典 顺序 不 一 样 ， 字 典 中 字母 的 顺序 表 通 常 如 下 。 


aAbBcCdDeEfFgGhHiIjJkKiLmMnNoOpPqQrRsStTuUUvVwWXxXyYzZ 


随 着 UNIX 在 美国 以 外 国家 的 普及 ， 人 们 越 来 越 希望 计算 机 能 支持 美式 英语 
中 找 不 到 的 字符 。 于 是 ，ASCI 字符 表 也 得 以 扩展 ， 开 始 使 用 8 位 二 进 制 来 表示 ， 
这 也 就 增加 了 第 188 一 255 的 字符 ， 兼 容 了 更 多 的 语言 。 为 了 支持 这 种 功能 ， 
POSIX 标准 引入 了 域 〈locale) 的 概念 ， 它 通过 不 停 调整 以 选择 特定 的 位 置 所 需 
要 的 字符 集 。 我 们 可 以 使 用 下 面 的 命令 行 查看 系统 的 语言 设置 。 


[me@linuxbox ~]$ echo $LANG 
en_US .UTF-8 


有 了 这 个 设置 , POSIX 兼容 的 应 用 程序 使 用 的 便 是 字典 中 的 字母 排列 顺序 ， 
而 不 是 用 ASCII 码 中 的 字符 排列 上 顺序。 这样 ， 便 解释 了 上 面 命令 行 的 诡异 行为 。 
A~Z 的 字符 范围 ， 用 字典 中 的 顺序 诠释 时 ， 包 括 了 字母 表 中 除了 小 写字 母 a 的 
所 有 字母 ， 因 此 使 用 命令 行 ls /usr/sbin/[A-Zj* 才 会 出 现 全 然 不 同 的 结果 。 


为 了 解决 这 一 问题 ，POSIX 标准 包含 了 许多 标准 字符 类 ， 这 些 字 符 类 提供 
了 一 些 有 用 的 字符 范围 ， 见 表 19-2。 


表 19-2 POSIX 字符 类 


字符 类 描述 

[:alnum:] 字母 字符 和 数字 字符 ， 在 ASCIH 码 中 ， 与 [A-Za-z0-9] 等 效 
[:word:] 基本 与 [:alnum:] 一 样 ， 只 是 多 了 一 个 下 划 线 字符 (_) 
[:alpha:] 字母 字符 ; 在 ASCII 中 ， 等 效 于 [A-Za-z] 

[:blank:] 包括 空格 和 制 表 符 

[cntrl:] ASCII 控制 码 ; 包括 ASCI 字符 0-31 以 及 127 

[:digit:] 数字 0~9 


[:graph:] 可 见 字 符 ， 在 ASCI 中 ， 包 括 字 符 33~126 
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续 表 

字符 类 描述 
[:iower:] 小 写字 母 
L:punct:] 标点 符号 字符 ， 在 ASCII 中 ， 与 [-1"#$%&'0*+,./:;<=>?@[\WN] 由 ~] 等 效 
[:print:] 可 打印 字符 ， 包 括 {:graph:] 中 的 所 有 字符 再 加 上 空格 字符 

空白 字符 如 空格 符 、 制 表 符 、 回 车 符 、 换 行 符 、 垂 直 制 表 符 以 及 换 页 符 。 在 ASCII 
Lspace:] 中 ， 等 效 为 [ \trin\w\f 
[:upper:] 大 写字 母 
[:xdigit:] 用 于 表示 十 六 进 制 的 字符 ;在 ASCII 中 ， 与 [0-9A-Fa-f] 等 效 


当然 ， 即 便 是 有 了 这 么 多 字符 类 ,仍然 没有 比较 方便 的 方法 表示 部 分 范围 ， 


如 [A-M]。 


使 用 字符 类 ,我 们 可 以 重复 上 述 大 写字 母 的 例子 ， 并 得 到 改善 的 输出 结果 。 


[me@linuxbox ~]$ ls /usr/sbin/i[:upper:]]* 
/usr/sbin/MAKEFLOPPIES 
/usr/sbin/NetworkManagerDispatcher 
/usr/sbin/NetworkManager 


然而 ， 请 记 住 ， 上 述 并 不 是 一 个 正则 表达 式 的 示例 ， 它 其 实 是 shell 路 径 名 
扩展 的 一 个 例子 。 在 此 处 提 及 ， 主 要 是 因为 这 两 种 用 法 都 支持 POSIX 字符 类 。 


恢复 为 传统 的 排列 顺序 


你 可 以 设置 自己 的 系统 采用 传统 的 (ASCII ) 字符 顺序 ， 方 法 就 是 改变 
LANG 环境 变量 的 值 。LANG 变量 包含 语言 的 名 称 以 及 该 语言 环境 中 使 用 的 
字符 集 ， 该 参数 值 在 安装 Linux 系统 选择 安装 语言 时 就 已 经 设 定 。 

要 查看 环境 设置 ， 使 用 下 面 的 locale 命令 。 


[me@linuxbox ~]$ locale 
LANG=en_US.UTF-8 
LC_CTYPE="en US.UTF-8" 

LC_ NUMERIC="en US.UTF-8" 
LC_TIME="en US.UTF-8" 

LC COLLATE="en US.UTF-8’ 

LC MONETARY="en US.UTF-8" 

LC MESSAGES="en US.UTF-8" 
LC_PAPER="en US.UTF-8" 

LC NAME="en US.UTF-8° 
LC_ADDRESS="en US.UTF-8" 
LC_TELEPHONE="en US.UTF-8" 
LC_MEASUREMENT="en US.UTF-8” 
LC_IDENTIFICATION="en US.UTF-8" 
te A 


将 环境 设置 为 使 用 传统 的 UNIX 行为 ， 可 将 LANG 变量 值 设 为 POSIX: 
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[meelinuxbox ~]$ export LANG=POSIX 
请 注意 , 这 样 的 改变 将 会 导致 系统 使 用 美式 英语 (更 精确 地 说 , 是 ASCII 

码 格式 ) 的 字符 集 ， 所 以 在 进行 此 改变 之 前 要 三 思 。 
如 果 想 永久 性 维持 该 变化 , 可 以 在 系统 .bashrc 文件 中 添加 下 面 的 命令 行 。 


export LANG=POSIX 


19.7 POSIX 基本 正则 表达 式 和 扩展 正则 表达 式 的 比较 


在 读者 正 觉得 正则 表达 式 已 经 复杂 得 不 能 再 复杂 时 ， 又 会 发 现 POSIX 规范 将 
正则 表达 式 的 实现 方法 分 为 了 两 种 : 基本 正则 表达 式 〈BRE) 和 扩展 正则 表达 式 
(ERE)。 到 目前 为 止 , 我 们 所 讨论 的 正则 表达 式 的 所 有 特性 ， 都 得 到 了 兼容 POSIX 
的 应 用 程序 的 支持 ， 并 且 都 是 以 BRE 的 方式 实现 。grep 命令 就 是 这 样 的 一 个 例子 。 

BRE 和 ERE 到 底 有 什么 区 别 ? 其 实 仅仅 是 元 字符 的 不 同 ! 在 BRE 方式 中 ， 
只 承认 ^ 、$、. 、[ 、] 、* 这 些 是 元 字符 ， 所 有 其 他 的 字符 都 被 识别 为 文字 字符 。 
而 ERE 中 ， 则 添加 了 (、 ) 、{ 、} 、?、 +|、 等 元 字符 (及 其 相关 功能 )。 

然而 〈 也 是 有 趣 的 部 分 )， 只 有 在 用 反 斜 枉 进行 转 义 的 情况 下 , 字符 (、)、{、} 
才 会 在 BRE 被 当 作 元 字符 处 理 ， 而 ERE 中 ， 任 何 元 符号 前 面 加 上 反 斜 杠 反而 
会 使 其 被 当 作 文字 字符 来 处 理 。 

由 于 下 面 要 讨论 的 特性 是 ERE 的 一 部 分 ， 所 以 需要 使 用 不 一 样 的 grep。 传 
统 上 ， 这 是 由 egrep 程序 来 执行 的 ， 但 是 GNU 版 本 的 grep 可 以 运用 -E 选项 以 
支持 ERE 方式 。 


POSIX 

在 20 世纪 80 年 代 ，UNIX 成 为 一 款 非 常 受 欢迎 的 商业 操作 系统 ， 但 是 直到 
1988 年 ，UNIX 世界 仍然 一 片 混乱 。 许 多 电脑 制造 商 从 UNIX 的 创造 者 AT&T 
获得 了 UNIX 源 代码 授权 ， 并 且 都 发 行 了 不 同 版 本 的 操作 系统 产品 。 然而， 制造 
商 在 努力 追求 产品 差异 化 的 同时 ,每 个 制造 商都 增加 了 自己 专用 的 变化 以 及 扩展 ， 
这 就 渐渐 限制 了 软件 的 兼容 性 。 由 于 一 直 由 专 有 厂商 销售 ， 所 以 每 一 个 厂商 都 想 
尽 办 法 锁定 它们 的 客户 群 。 UNTX 史上 的 这 段 黑暗 时 期 被 大 家 称 之 为 “割据 时 代 ”。 
接着 , 我 们 进入 了 IEEE ( Institute of Electrical and Electronics Engineers ) 时 

代 。 在 20 世纪 80 年 代 中 期 ，IEEE 开始 开发 一 套 规范 UNIX 和 类 UNIX 系统 
工作 方式 的 标准 。 这 些 标准 ， 官 方 名 称 是 IEEE 1003， 定 义 了 应 用 程序 接口 
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( API )、shell 以 及 一 些 实用 程序 ， 它 们 可 以 在 标准 类 UNIX 系统 中 找到 。 该 标 
准 由 Richard Stallman 提议 命名 为 POSIX， 它 是 Portable Operating System 
Interface (末尾 增加 于 只 是 为 了 更 流畅 ) 的 缩写 ， 后 来 被 IEEE 采纳 。 


19.8 ”或 选项 


我 们 将 要 讨论 的 第 一 个 扩展 正则 表达 式 的 特性 是 或 选项 (alternation), 它 是 
用 于 匹配 表达 式 集 的 工具 。 括 号 表达 式 可 以 从 指定 字符 集中 匹配 单一 字符 ， 而 
或 选项 则 用 于 从 字符 串 集 或 正则 表达 式 集中 寻找 匹配 项 。 


以 下 便利 用 grep 结合 echo 作为 演示 实例 。 首 先 , 我 们 进行 一 个 简单 的 字符 
串 匹 配 。 


[me@linuxbox ~]$ echo “AAA" | grep AAA 
AAA 


[meelinuxbox ~]$ echo "BBB" | grep AAA 
[me@linuxbox -~]$ 


这 是 一 个 非常 直 白 的 例子 , 将 echo 的 输出 结果 送 至 grep 进行 匹配 搜索 。 如 
果 匹 配 成 功 ， 结 果 便 输出 打印 出 来 ， 如 无 匹配 项 ， 则 无 结果 输出 。 
现在 添加 或 选项 ， 它 用 元 字符 “|” 表 示 。 
{me@linuxbox ~]$ echo "AAA" | grep -E 'AAA|BBB' 
AAA 
[me@linuxbox ~]$ echo "BBB" | grep -E 'AAA|BBB' 
BBB 


[me@linuxbox ~]$ echo "CCC" | grep -E ‘AAA|BBB' 
[meelinuxbox ~]$ 


这 里 出 现 了 'AAAIBBB' 正 则 表达 式 ， 此 表达 式 的 含义 是 “匹配 字符 串 AAA 
或 者 匹配 字符 串 BBB”。 请 注意 ， 由 于 此 处 使 用 的 是 扩展 特性 ， 所 以 grep 增加 
了 -E 选项 (虽然 可 以 使 用 egrep 命令 来 代替 )， 并 且 将 正则 表达 式 用 引号 引起 来 
以 防止 shell 将 元 字符 “|” 当 作 管 道 操作 符 来 处 理 。 另 外 ， 或 选项 并 不 局 限于 两 
种 选择 ， 还 可 以 有 更 多 的 选择 项 。 


[me@linuxbox -]$ echo “AAA" | grep -E ‘AAA|BBB|CCC!' 
AAA 


为 了 将 或 选项 可 与 其 他 正则 表达 式 符 号 结合 使 用 ， 我 们 可 以 用 “0 ”将 或 选 
项 的 所 有 元 素 与 其 他 符号 隔 开 。 


[me@linuxbox ~]$ grep -Eh '^(bz|gz|zip)' dirlist*.txt 
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以 上 表达 式 的 含义 是 匹配 文件 名 以 bz、gz 或 是 zip 开头 的 文件 。 如 果 不 使 
用 括号 “()”， 该 正则 表达 式 的 含义 就 完全 不 同 ， 其 匹配 的 便 是 文件 名 以 bz 开 
头 或 者 是 包含 gz 和 zip 的 文件 。 


[me@linuxbox ~]$ grep -Eh '“^bzj|gzlzlp' dirlist*.txt 


19.9 限定 符 
扩展 正则 表达 式 (ERE) 提供 多 种 方法 指定 某 元 素 匹 配 的 次 数 。 


19.9.1 ? 一 一 匹配 某 元 素 0 次 或 1 次 


该 限定 符 实际 上 意味 着 “前 面 的 元 素 可 选 ”。 比如， 如 果 我 们 想 检 查 某 电话 号 
码 的 有 效 性 。 所 谓 电 话 号 码 有 效 ， 指 的 是 电话 号 码 必须 是 下 面 两 种 形式 
(nnn)jnnn-nnnn 和 nnn nnn-nnnn 中 的 一 种 ， 其 中 n 是 数值 。 于 是 ， 我 们 可 以 构造 如 
下 所 示 的 正则 表达 式 。 
~^\(?[0-9][0-9][0-9]\)? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$ 

此 表达 式 中 ， 括 号 字符 的 后 面 增加 了 “? ”符号 以 表示 括号 字符 只 能 匹配 
一 次 或 零 次 。 同 样 ， 由 于 括号 字符 在 ERE 中 通常 是 元 字符 ， 所 以 其 前 面 加 上 了 
反 斜 杠 告诉 shell 此 括号 为 文字 字符 。 


示例 如 下 。 


[me@linuxbox -]$ echo “(555) 123-4567" | grep -E '^\(?[0-9] [0-9][0-9]\)? [0-9] 
[0-9]10-9]$' 

(555) 123-4567 

[me@linuxbox ~]$ echo "555 123-4567" | grep -E '^\(?[0-9][0-9] [0-9]\)? [0-9] 
[0-9][0-9]-[0-9] [0-9] [0-9][0-9]$' 

555 123-4567 

[me@linuxbox ~]$ echo "AAA 123-4567°" | grep -E '^\(?[0-9][0-9]{0-9]\)? [0-9] 
[0-9] [0-9]-[0-9][0-9][0-9][0-9]$" 

[me@linuxbox ~]$ 


由 此 可 以 看 出 ， 该 表达 式 匹配 了 上 述 两 种 形式 的 电话 号 码 ， 但 不 匹配 那些 
包含 非 数字 字符 的 号 码 。 


19.9.2 * 匹配 某 元 素 多 次 或 零 次 


与 “? ”元 字符 类 似 ,“* ”用 于 表示 一 个 可 选择 的 条 目 。 然 而 ， 与 “?” 不 
同 ， 该 条 目 可 以 多 次 出 现 ， 而 不 仅仅 是 一 次 。 例 如 ， 如 果 我 们 想 知道 一 串 字 符 是 
否 是 一 句 话 ， 也 就 是 说 ， 这 串 字符 是 否 以 大 写字 母 开头 而 以 句号 结束 ， 并 且 中 间 
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内 容 是 任意 数目 的 大 小 写字 母 和 空格 ， 那 么 要 匹配 这 种 非常 粗糙 的 句子 定义 ， 可 
以 用 如 下 正则 表达 式 。 
[[:upper:1]{[:upper:][:lower:] 1*\. 

该 表达 式 包 含 了 三 个 条 目 : 包含 [:upper:] 字 符 类 的 中 括号 表达 式 、 包 含 
[:upper] 和 [:lower:] 两 个 字符 类 以 及 一 个 空格 的 中 括号 表达 式 、 用 反 斜 杠 转 义 过 
的 圆 点 符号 。 第 二 个 条 目 后 面 紧 跟着 “* ”元 字符 ， 所 以 只 要 句子 的 第 一 个 字母 
是 大 写字 母 ， 后 面 不 管 会 出 现 多 少数 目的 大 小 写字 母 都 无 关 紧要 。 

[me@linuxbox ~]$ echo "This works." | grep -E ‘'[[:upper:]][[:upper:]{:lower:] 


This works. 


[meelinuxbox ~]$ echo “This Works." | grep -E ‘[[:upper:]]{[:upper:]{:lower:] 
] 

This Works . 

[me@linuxbox ~]$ echo "this does not" | grep -E '[{:upper:]]{[:upper:][:1lower: 
] ] 


[meaelinuxbox ~-]$ 


该 表达 式 匹 配 前 两 个 测试 语句 ， 但 是 不 匹配 第 三 个 ， 原 因 是 它 的 首 字 母 不 
是 大 写 并 且 末 尾 没 有 句号 。 


19.9.3 + 一 一 匹配 某 元 素 一 次 或 多 次 


“+” 元 字符 与 “* ”非常 类 似 ， 只 是 “+” 要 求 置 于 其 前 面 的 元 素 至 少 出 现 
一 次 。 示 例如 下 ， 该 正则 表达 式 用 于 匹配 由 单个 空格 分 隔 的 一 个 或 者 多 个 字母 
字符 组 成 的 行 。 

“^(f[[:alpha:]]+ ?)+$ 

示例 如 下 。- 

[meelinuxbox ~]$ echo “This that" | grep -E '^([[:alpha:]]j+ ?)+$' 
This that 

[eeri nuxbox ~]$ echo "a bc" | grep -E'^([f:alpha:]]+ ?)+$' 
[meelinuxbox ~]$ echo "ab 9" | grep -E ‘'^([[:alipha:]]+ ?)+$' 


[meelinuxbox ~]$ echo “abc d" | grep -E '^([[:alpha:]]+ ?)+$: 
[me@linuxbox ~]$ 


我 们 可 以 看 到 此 表达 式 并 不 匹配 “a b 9” 这 一 行 ， 因 为 该 行 包 含 了 非 字母 字 
符 “9”， 同 样 也 不 匹配 “abc d” 这 一 行 ， 因 为 c 和 d 之 间 被 多 个 空格 符 分 开 了 。 


19.9.4 1 一 一 以 指定 次 数 匹配 某 元 素 
“{” 和 “}” 元 字符 用 于 描述 最 小 和 最 大 次 数 的 需求 匹配 。 可 以 通过 4 种 方 
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法 来 指定 ， 见 表 19-3。 
表 19-3 指定 匹配 次 数 


指定 项 含义 

{n} 前 面 的 元 素 恰 好 出 现 n 次 则 匹配 

{mm} 前 面 的 元 素 出 现 的 次 数 在 n~m 次 之 间 时 则 匹配 
{n,} 前 面 的 元 素 出 现 次 数 超过 次 则 匹配 

Lm} 前 面 的 元 素 出 现 次 数 不 超 过 m 次 则 匹配 


回 到 前 面 电话 号 码 的 例子 ， 我 们 可 以 运用 此 处 讲 到 的 指定 重复 次 数 的 办 法 
将 原来 的 正则 表达 式 
“^\(?[0-9][0-9][0-9]\)? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$” 
简化 为 
“\(?[0-91{3}\)? [0-9]{3}-[0-9] {4}$” 

示例 如 下 : 
[meelinuxbox ~]$ echo "(555) 123-4567" | grep -E '^\(?[0-9]{3}\)? [0-9]{3}-[0- 
ni 
[meelinuxbox ~]$ echo "555 123-4567" | grep -E '^\(?[0-9]{3}\)? [0-9]{3}-[0-9] 
i 
[meelinuxbox ~]$ echo "5555 123-4567" | grep -E '^\(?[0-9]{3}\)? [0-9]{3}-[0-9 
和 

结果 表明 ， 修 改 后 的 表达 式 不 管 有 无 括号 都 可 验证 数字 的 有 效 性 ， 并 剔除 
那些 格式 不 正确 的 数字 。 


19.10 “正则 表达 式 的 应 用 
让 我 们 回顾 一 些 前 面 已 经 用 过 的 命令 ， 观 察 它们 如 何 使 用 正则 表达 式 。 


19.10.1 用 grep 命令 验证 号 码 簿 


前 面 的 例子 中 ， 我 们 只 验证 了 一 个 电话 号 码 的 有 效 性 ， 而 检验 一 个 号 码 列 
表 往 往 才 是 实际 需求 ， 所 以 我 们 先 创 建 一 个 号 码 列表 。 于 是 ， 我 们 在 命令 行 中 
输入 一 些 “ 神 奇 的 咒语 ”以 创建 号 码 列表 ， 之 所 以 称 其 为 “神奇 ”是 因为 里 面 
多 数 命令 到 目前 为 止 本 书 还 未 涉及 到 。 不 过 不 用 担心 ， 我 们 将 在 下 面 的 章节 中 


19.10.2 
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会 详细 讲述 。 下 面 的 代码 便 是 神奇 咒语 的 内 容 。 


[me@linuxbox ~]$ for 1 in {1..10}; do echo "(S${RANDOM:0:3}) ${RANDOM:0:3}-$ 
{RANDOM:0:4}" >> phonelist.txt; done 


该 命令 行 会 产生 一 个 包含 10 个 电话 号 码 的 名 为 phonelist.txt 的 文件 。 每 次 
重复 该 命令 行 ， 该 列表 就 会 添加 10 个 号 码 。 我 们 也 可 以 通过 更 改 命令 行 前 端 
的 数字 10 来 指定 创建 更 多 或 更 少 的 电话 号 码 。 然 而 ， 如 果 检 查 文件 内 容 ， 我 
们 会 发 现 如 下 问题 。 

[me@linuxbox ~]$ cat phonelist.txt 
(232) 298-2265 
(624) 381-1078 
(540) 126-1980 
{874) 163-2885 
{286) 254-2860 
{292) 108-518 
{129) 44-1379 
{458) 273-1642 


(686) 299-8268 
(198) 307-2440 


其 中 有 部 分 数字 是 畸形 的 ， 而 这 正好 满足 我 们 的 练习 要 求 ， 因 为 接 下 来 就 
是 要 用 grep 判断 它们 的 有 效 性 。 

进行 有 效 验证 ， 可 对 文件 内 容 进行 扫描 以 搜索 无 效 数 字 ， 并 将 结果 显示 出 来 。 
[me@linuxbox ~]$ grep -Ev '“\([0-9]{3}\) [0-9]{3}-[0-9]{4}$' phonelist.txt 
(292) 108-518 


(129) 44-1379 
[me@linuxbox -]$ 


此 处 我 们 使 用 了 -v 选项 输出 相反 结果 ， 也 就 是 输出 列表 中 不 符合 指定 表达 
式 的 那些 行 。 此 表达 式 本 身 在 每 行 末尾 使 用 了 锚 元 字符 ， 从 而 确保 每 一 个 数字 
末尾 没有 多 余 的 字符 。 另 外 ， 本 表达 式 要 求 有 效 的 号 码 中 必须 要 有 括号 ， 与 前 
面 所 举 的 号 码 例子 有 稍 许 不 同 。 


用 find 查找 奇怪 文件 名 的 文件 


find 命令 的 test 选项 可 以 用 正则 表达 式 表示 。 运 用 正则 表达 式 时 ，find 和 
grep 有 一 点 不 同 ，grep 命令 是 搜索 那些 只 包含 与 指定 表达 式 匹配 的 字符 串 的 
行 ,而 find 则 要 求 文件 名 与 指定 表达 式 完全 一 致 。 下 面 的 例子 中 , 我 们 将 利用 
find 命令 结合 正则 表达 式 来 查找 文件 名 中 不 包含 如 下 所 示 集 合 中 的 任 一 字符 
的 文件 。 


{[-_./0-9a-zA-Z] 
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令 行 大 全 


用 此 表达 式 进 行 搜索 ， 将 会 输出 文件 名 中 包含 内 嵌 空 格 以 及 其 他 潜在 不 规 
范 字符 的 文件 。 
[me@linuxbox ~]$ find . -regex '.*[^-._./0-9a-zA-Z].*' 

由 于 要 求 整个 路 径 名 与 正则 表达 式 的 描述 完全 一 致 ， 所 以 表达 式 的 两 端 增 
加 了 “.*” 以 匹配 0 个 或 多 个 字符 。 在 表达 式 的 中 间 部 分 ， 我 们 使 用 了 一 个 否定 
的 中 括号 表达 式 ， 其 中 包含 了 可 接受 的 路 径 名 字符 集 。 


用 locate 查找 文件 


locate 命令 既 支 持 基 本 正则 表达 式 (--regexp 选项 ), 也 支持 扩展 正则 表达 式 
(--regex 选项 )。 利 用 locate， 可 以 完成 之 前 对 dirlist 文件 所 做 的 许多 操作 。 


[me@linuxbox -~]$ locate --regex 'bin/(bz|gzizip)， 
/bin/bzcat 
/bin/bzcmp 
/bin/bzdiff 
/bin/bzegrep 
/bin/bzexe 
/bin/bzfgrep 
/bin/bzgrep 
/bin/bzip2 
/bin/bzip2recover 
/bin/bzless 
/bin/bzmore 
/bin/gzexe 
/bin/gzip 
/usr/bin/zip 
/usr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/zipsplit 


利用 或 选项 ， 我 们 搜索 到 了 那些 路 径 名 中 包含 bin/bz、bin/gz 或 /bin/zip 等 
字符 串 的 文件 。 


利用 less 和 vim 命令 搜索 文本 
less 和 vim 采用 同样 的 方法 进行 文本 搜索 。 按 下 “/” 键 后 输入 正则 表达 式 ， 
即 开始 进行 搜索 。 我 们 可 以 利用 less 查看 phonelist txt 文件 的 内 容 : 
[meelinuxbox -]$ 1ess phonelist.txt 
然后 查找 有 效 的 表达 式 。 


(232) 298-2265 
(624) 381-1078 
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(540) 126-1980 
(874) 163-2885 
(286) 254-2860 
(292) 108-518 
(129) 44-1379 
(458) 273-1642 
(686) 299-8268 
(198) 307-2440 


/*\(IO-9]{3}\) [0-9]{3}-[0-9]{4}$ 


less 会 以 高 亮 的 方式 显示 匹配 字符 传 ， 这 样 就 很 容易 找到 那些 无 效 的 号 码 。 


男 一 方面 ，vim 也 支持 基本 正则 表达 式 ， 所 以 ， 我 们 可 以 用 下 面 的 搜索 表达 式 。 
/1([0-91\{3\}) [0-9]\{3\}-[0-9]\{4\} 

可 以 看 到 ， 表 达 式 基本 一 样 。 然 而 ， 在 扩展 表达 式 中 被 当 作 元 字符 的 许多 
字符 在 ， 在 基本 表达 中 则 被 看 作文 字 字 符 ， 只 有 使 用 反 斜 杠 转 义 后 才 会 被 当 作 
元 字符 。 匹 配 项 是 否 以 高 亮 形式 显示 ， 则 取决 于 自己 系统 上 vim 的 设置 。 如 果 
没有 ， 请 尝试 在 命令 模式 中 输入 hlsearch 以 激活 高 亮 搜索 。 


注意 由 于 Linux 发 行 版 本 的 不 同 ，vim 可 能 不 支持 文本 高 亮 搜索 。 尤 其 是 Ubuntu， 
其 默认 提供 了 一 个 vim 的 精简 版 本 。 在 这 样 的 系统 上 ， 可 能 会 需要 用 软件 包 管 
理 器 来 安装 一 个 较 完 整 的 vim 版 本 。 


19.11 ”本章 结 尾 语 


本 章 介绍 了 正则 表达 式 的 很 多 用 法 。 当 然 ， 如 果 用 它们 进行 一 些 额 外 的 应 
用 搜索 ， 你 会 发 现 正 则 表达 式 有 更 多 的 用 途 。 我 们 可 以 通过 查看 man 手册 页 获 
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取 更 详细 的 内 容 。 


[meelinuxbox ~]$ cd /usr/share/man/man1 
[meelinuxbox man1]$ zgrep -El 'regex|regular expression' *.gz 


zgrep 程序 比 grep 在 前 端 多 了 一 个 字母 z， 由 此 便 可 以 对 压缩 文件 进行 搜索 。 
本 例 中 , 我们 在 man 文件 通常 存放 的 目录 下 对 压缩 的 第 一 部 分 man 手册 页 进行 
了 搜索 。 该 命令 行 的 输出 结果 是 一 列 包含 字符 串 regex 或 regular expression 的 文 
件 。 可 以 看 到 ， 正 则 表达 式 可 用 于 大 量 应 用 程序 中 。 


本 章 未 谈 及 基本 正则 表达 式 的 另外 一 个 特性 一 一 后 向 引用 (back 
reference)， 该 特性 将 在 下 一 章 中 进行 详解 。 


#20s 
文本 处 理 


由 于 所 有 类 UNIX 操作 系统 都 严重 依赖 于 文本 文件 来 进行 某 些 数据 类 型 的 


存储 ， 所 以 需要 有 很 多 可 以 进行 文本 操作 的 工具 。 本 章 主要 介绍 一 些 与 “切割 ” 
文本 有 关 的 命令 ， 第 21 章 会 进一步 探讨 文本 处 理工 具 ， 并 重点 讲解 那些 用 于 格 
式 化 文本 输出 以 及 其 他 满足 人 类 需求 的 程序 。 


本 章 首先 会 回顾 之 前 讲 过 的 一 些 命令 ， 然 后 讲解 一 些 新 的 命令 。 
cat: 连接 文件 并 打印 到 标准 输出 。 

sort: 对 文本 行 排序 。 

uniq: 报告 并 省 略 重复 行 。 

cut: 从 每 一 行 中 移 除 文本 区 域 。 

paste: 合并 文件 文本 行 。 

join: 基于 某 个 共享 字段 来 联合 两 个 文件 的 文本 行 。 
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。 comm: 逐 行 比较 两 个 已 经 排 好 序 的 文件 。 
。 diff: 逐 行 比较 文件 。 

。 patch: 对 原文 件 打 补 丁 。 

。 tr: 转换 或 删除 字符 。 

。 sed: 用 于 过 滤 和 转换 文本 的 流 编 辑 器 。 
。 aspel: 交互 式 拼写 检查 器 。 


20.1 文本 应 用 程序 


到 目前 为 止 我 们 总 共 介 绍 了 两 种 文本 编辑 器 (nano 和 vim)， 看 过 一 堆 配 
置 文件 ， 并 且 目睹 了 许多 命令 的 输出 都 是 文本 格式 。 那 么 ， 除 了 这 些 ， 文 本 操 
作 还 有 哪些 用 途 ? 事实 证 明 ， 它 还 有 很 大 用 途 。 


20.1.1 文件 


许多 人 都 采用 纯 文本 格式 编辑 文件 。 虽 然 大 家 都 知道 用 一 些 较 小 的 文本 文 
件 进 行 一 些 简单 的 笔记 很 方便 、 很 实用 ， 但 同样 ， 我 们 也 可 以 用 文本 格式 编辑 
较 大 的 文档 。 有 一 种 常用 的 方法 ， 即 首先 在 文本 编辑 器 中 编辑 大 型 文档 的 内 容 ， 
然后 使 用 标记 语言 描述 文件 格式 。 许 多 科学 论文 就 是 用 这 种 方式 撰写 的 ， 因 为 
基于 UNIX 的 文本 处 理 系 统 是 最 早 一 批 支 持 先进 排版 布局 的 ， 而 这 些 先进 的 排 
版 技术 又 正 是 技术 领域 的 专家 们 所 需要 的 。 


20.1.2 网 页 
网 页 可 以 说 是 世界 上 最 常 见 的 电子 文档 。 网 页 属于 文本 文档 ， 一 般 使 用 HTML 
(Hypertext Markup Language) 或 者 XML (eXtensible Markup Language) 等 标记 
语言 描述 内 容 的 可 视 化 形式 。 


20.1.3 ”电子 邮件 


电子 邮件 本 质 上 是 一 种 基于 文本 的 媒介 ， 即 便 是 非 文本 附件 ， 在 传输 的 
时 候 也 会 被 转 成 文本 格式 。 读 者 可 以 亲自 验证 这 一 点 ， 首 先 下 载 一 个 电子 邮 
件 信息 并 用 less 命令 查看 其 内 容 ， 就 会 发 现 其 内 容 包含 一 个 header 开头 ， 其 
描述 的 是 此 封 邮件 的 来 源 及 其 在 传输 过 程 中 所 经 历 的 处 理 ， 然 后 才 是 邮件 信 
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息 的 正文 。 


20.1.4 ”打印 机 输出 


在 类 UNIX 系统 中 ， 准 备 向 打印 机 传送 的 信息 是 以 纯 文 本 格式 传送 的 。 如 
果 该 页 包含 图 像 , 则 将 其 转换 成 PostScript 文本 格式 页 面 描述 语言 后 再 送 至 指定 
程序 以 打印 图 像 像 素 。 


20.1.5 ”程序 源 代码 


类 UNIX 系统 中 的 许多 命令 行程 序 都 是 为 了 支持 系统 管理 和 软件 开发 而 编 
写 的， 文本 处 理 程序 也 不 例外 。 它 们 中 多 数 是 为 解决 软件 开发 问题 而 设计 的 。 
文本 处 理 对 软件 开发 者 如 此 重要 ， 是 因为 所 有 的 软件 都 是 从 文本 开始 ， 程 序 员 
实际 所 编写 的 源 代 码 ， 也 总 是 以 文本 的 形式 编辑 。 


20.2 温 故 以 求 新 


在 第 6 章 ， 我 们 学 习 了 一 些 既 支持 命令 行 参 数 输入 也 支持 标准 输入 的 命 
令 。 不 过 当时 只 是 泛泛 而 谈 ， 现 在 我 们 将 详细 讨论 这 些 命令 如 何 用 于 文本 
处 理 。 


20.2.1 cat 一 一 进行 文件 之 间 的 拼接 并 且 输 出 到 标准 输出 


cat 命令 有 许多 有 趣 的 参数 选项 ， 而 其 中 多 数 则 是 用 于 提高 文本 内 容 的 可 视 
化 效果 。-A 选项 就 是 一 个 例子 ， 它 用 于 显示 文本 中 的 非 打印 字符 。 例 如 ， 用 户 
有 时 会 想 知道 可 见 文本 中 是 否 嵌 入 了 控制 字符 , 其 中 最 为 常见 的 就 是 制 表 符 (而 
不 是 空格 ) 以 及 回 车 符 ， 在 MS-DOS 风格 的 文本 文件 中 ， 回 车 符 经 常 作为 结束 
符 出 现 。 另 一 种 常见 情况 是 文件 中 包含 末尾 带 有 空格 的 文本 行 。 


我 们 创建 一 个 测试 文件 ， 用 cat 程序 作为 一 个 简单 的 文字 处 理 器 。 为 此 ， 只 
需要 输入 cat 命令 《随后 指定 了 用 于 重 定向 输出 的 文件 ) 再 输入 文本 内 容 ， 按 
Enter 键 结束 行 输入 ， 最 后 按 下 Ctrl-D 告诉 cat 到 达 文 件 末尾 。 下 例 中 ， 我 们 输 
入 了 一 个 以 Tab 制 表 符 开头 、 空 格 符 结尾 的 文本 行 。 

[me@linuxbox ~]$ cat > foo.txt 


The quick brown fox jumped over the lazy dog. 
[me@linuxbox ~]$ 
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下 面 ， 我 们 利用 带 有 -A 选项 的 cat 命令 显示 文本 内 容 : 


Ime@linuxbox ~]$ cat -A foo.txt 
^IThe quick brown fox jumped over the lazy dog. $ 
[me@linuxbox ~]$ 


输出 结果 表明 ,文本 中 的 Tab 制 表 符 由 符号 “^I” 表 示 。 这 是 一 种 常见 的 表 
示 方 法 ， 意 思 是 “Ctrl-I”， 结 果 证 明 ， 它 等 同 于 Tab 制 表 符 。 同 时 ， 在 文件 末尾 
出 现 的 “$” 符 说 明 行 末 尾 存 在 空格 。 


MS-DOS 文本 与 UNIX 文本 的 比较 

我 们 利用 cat 查找 文本 中 的 非 打 印字 符 , 原因 之 一 是 cat 可 以 发 现 隐 藏 的 
回 车 符 。 而 这 些 隐藏 的 回 车 符 来 自 哪里 呢 ? 当然 是 DOS 和 Windows! UNIX 
和 DOS 在 文本 文件 中 定义 每 行 结束 的 方式 并 不 相同 , UNIX 以 换行 符 (ASCII 
码 10) 作为 行 末 尾 ， 而 MS-DOS 系统 及 其 衍生 系统 则 使 用 回 车 符 (ASCII 码 
13 ) 和 换行 符 共同 作为 行 末尾 。 

有 人 几 种 方法 可 以 将 文件 从 DOS 格式 转化 为 UNIX 格式 .许多 Linux 系统 ， 
都 自 带 dos2UNIX 和 UNIX2dos 程序 ， 它 们 用 于 DOS 和 UNIX 格式 之 间 的 相 
互 转 换 。 然 而 ， 即 便 系 统 中 没有 dos2UNIX 程序 也 没关系 ，DOS 格式 转换 为 
UNIX 格式 的 过 程 非常 简单 , 只 要 将 多 余 的 回 车 符 删 除 就 可 以 , 此 过 程 可 以 用 
本 章 后 续 所 讲 的 一 些 程 序 很 简单 地 实现 . 


cat 也 有 很 多 用 于 修改 文本 的 参数 选项 。 最 著名 的 两 个 选项 : -n， 对 行 编号 ; 
-sS， 禁 止 输出 多 个 空白 行 。 示 例如 下 。 


[meelinuxbox ~]$ cat > foo.txt 
The quick brown fox 


jumped over the lazy dog， 
[me@linuxbox ~]$ cat -ns foo.txt 
1 The quick brown fox 
2 


3 jumped over the lazy dog. 
[me@linuxbox ~]$ 


本 例 中 , 我 们 创建 了 一 个 foo.txt 测试 文件 的 新 版 本 ， 该 文件 内 容 为 两 个 文本 行 ， 
并 以 空白 行 隔 开 。 用 cat 加 -ns 选项 对 其 操作 后 ， 多 余 的 空白 行 便 被 移 除 ， 并 对 剩余 
的 行进 行 了 编号 。 然 而 这 并 不 是 多 个 进程 在 操作 这 个 文本 ， 只 有 一 个 进程 。 


20.2.2 sort 一 一 对 文本 行进 行 排序 
sort 是 一 个 排序 程序 ， 它 的 操作 对 象 为 标准 输入 或 是 命令 行 中 指定 的 一 个 或 
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多 个 文件 后 将 结果 送 至 标准 输出 。 与 cat 用 法 类 似 ， 如 下 所 示 ， 我 们 将 直接 使 用 
键盘 演示 标准 输入 内 容 的 处 理 过 程 。 

[me@linuxbox ~]$ sort > foo.txt 

1 

i ~]$ cat foo.txt 


b 
CC 


输入 sort 命令 后 ， 输 入 字母 c、b、a， 最 后 按 下 Ctrl-D 结束 输入 。 然 后 查看 
处 理 结 果 ， 会 发 现 这 些 行 都 以 排 好 的 顺序 出 现 。 

由 于 sort 命令 允许 多 个 文件 作为 其 输入 参数 ， 所 以 可 以 将 多 个 文件 融合 为 
一 个 已 排序 的 整体 文件 。 例 如 ， 我 们 有 三 个 文本 文件 ， 并 期 望 将 它们 拼接 为 一 
个 已 排序 的 整体 文件 。 我 们 可 以 用 下 面 的 命令 行 去 执行 。 


sort file1.txt file2.txt file3.txt > final sorted list.txt 
sort 有 一 些 有 趣 的 选项 。 表 20-1 列 出 了 部 分 。 
表 20-1 常见 的 sort 选项 


选项 全 局 选项 表示 描述 
默认 情况 下 ， 整 个 行 都 会 进行 排序 操作 ， 也 就 是 从 行 的 第 一 

-b 一 ignore-leading-blanks ”个 字符 开始 。 添 加 该 选项 后 ，sort 会 忽略 行 开头 的 空格 ， 并 
且 从 第 一 个 非 空白 字符 开始 排序 

f --ignore-case 排序 时 不 区 分 字符 大 小 写 

二 ri 基于 字符 串 的 长 度 进行 排序 。 该 选项 使 得 文件 按 数 值 顺序 而 
不 是 按 字母 表 顺 序 进行 排序 

-I --reverse 逆序 排序 。 输 出 结果 按照 降序 排列 而 不 是 升序 

k --key= field1[,field2] 对 .field1 与 fiel4d2 之 间 的 字符 排序 ， 而 不 是 整个 文本 行 


将 每 个 输入 参数 当 作 已 排 好 序 的 文件 名 。 将 多 个 文件 合并 为 
一 个 排 好 序 的 文件 ， 而 不 执行 额外 的 排序 操作 


-0 --output= file 将 排序 结果 输出 到 文件 而 不 是 标准 输出 
定义 字段 分 隔 符 。 默 认 情 况 下 ， 字 段 是 由 空格 或 制 表 符 分 
开 的 


-m --merge 


-t --field-separator=char 


尽管 以 上 多 数 选 项 的 作用 都 易 从 其 字面 意义 中 看 出 ， 但 也 有 一 些 例 外 ， 用 
于 数值 排序 的 -n 选项 就 是 一 个 例子 。 该 参数 选项 可 使 sort 根据 数值 进行 排序 。 
作为 演示 , 我 们 可 将 du 命令 的 输出 结果 进行 排序 , 以 确定 最 大 的 硬盘 空间 用 户 。 
正常 情况 下 ，du 命令 会 列 出 一 个 以 路 径 名 顺序 排列 的 列表 。 
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0 
[me@linuxbox ~]$ du -s /usr/share/* | head 


252 /usr/share/aclocal 

96 /usr/share/acpi-support 

8 /usr/share/adduser 

196 /usr/share/alacarte 

344 /usr/share/alsa 

8 /usr/share/alsa-base 

12488 /usr/share/anthy 

8 /usr/share/apmd 

21440 /usr/share/app-install 

48 /usr/share/application-registry 


本 例 中 ， 我 们 把 结果 管道 到 head 命令 ， 把 输出 结果 限制 为 只 显示 前 10 行 。 
我 们 能 够 产生 一 个 按 数 值 排序 的 列表 ， 来 显示 10 个 最 大 的 空间 消费 者 。 


[me@linuxbox ~]$ du -ss /usr/share/* | sort -nr | head 


509940 /usr/share/locale-langpack 
242660 /usr/share/doc 

197560 /usr/share/fonts 

179144 /usr/share/gnome 

146764 /usr/share/myspelil 

144304 /usr/share/gimp 

135880 /usr/share/dict 

76508 /usr/share/icons 

68072 /usr/share/apps 

62844 /usr/share/foomatic 


通过 使 用 -nr 参数 选项 ， 我 们 便 可 以 产生 一 个 逆向 的 数值 排序 ， 它 使 得 最 
大 数值 排列 在 第 一 位 。 这 种 排序 起 作用 是 因为 数值 出 现在 每 一 行 的 开头 。 但 是 
如 果 我 们 想 要 基于 文本 行 中 的 某 个 数值 排序 ， 又 会 怎样 呢 ? 例如 ,命令 ls-] 的 
输出 结果 : 


[me@linuxbox ~]$ 1s -1 /usr/bin | head 
total 152948 


-rwxr-xr-x 1 root root 34824 2012-04-04 02:42 [ 

-rwxr-xr-x 1 root root 101556 2011-11-27 06:08 a2p 
-Pwxr-xr-x 1 root root 13036 2012-02-27 08:22 aconnect 
-Pwxr-xr-x 1 root root 10552 2011-08-15 10:34 acpi 
-rwxr-xr-x 1 root root 3800 2012-04-14 03:51 acpi fakekey 
-rwxr-xr-x 1 root root 7536 2012-04-19 00:19 acpi listen 
-rwxr-xr-x 1 root root 3576 2012-04-29 07:57 addpart 
-rwxr-xr-x 1 root root 20808 2012-01-03 18:02 addr2line 
-rwxr-xr-x 1 root root 489704 2012-10-09 17:02 adept_batch 


此 刻 ， 和 忽略 ls 命令 自 有 的 根据 文件 大 小 排序 的 功能 ， 而 用 sort 程序 依据 文 
件 大 小 进行 排序 。 


[me@linuxbox ~]$ 1s -1 /usr/bin | sort -nr -k 5 | head 
-rwxr-xr-x 1 root root 8234216 2012-04-07 17:42 inkscape 
-rwxr-xr-x 1 root root 8222692 2012-04-07 17:42 inkview 
-Fwxr-xr-x 1 root root 3746508 2012-03-07 23:45 gimp-2.4 
-rwxr-xr-x 1 root root 3654020 2012-08-26 16:16 quanta 
-rwxr-xr-x 1 root root 2928760 2012-09-10 14:31 gdbtui 
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-rwxr-xr-x 1 root root 2928756 2012-09-10 14:31 gdb 
-Fwxr-xr-x 1 root root 2602236 2012-10-10 12:56 net 
-Fwxr-xr-x 1 root root 2304684 2012-10-10 12:56 rpcclient 
-rwxr-xr-x 1 root root 2241832 2012-04-04 05:56 aptitude 
-rwxr-xr-x 1 root root 2202476 2012-10-10 12:56 smbcacls 


sort 的 许多 用 法 都 与 表格 数据 处 理 有 关 ， 比 如 上 面 ls 命令 的 输出 结果 。 如 
果 我 们 把 数据 库 这 个 术语 应 用 到 上 面 的 表格 中 , 我 们 会 说 每 一 行 就 是 一 项 记录 ， 
而 每 一 个 记录 又 包含 多 个 字段 ， 诸 如 文件 属性 、 链 接 数 、 文 件 名 、 文 件 大 小 等 。 
sort 能 够 处 理 独立 的 字段 , 在 数据 库 术 语 中 , 我 们 可 以 指定 一 个 或 多 个 关键 字段 
作为 排序 的 关键 值 。 在 上 面 的 例子 中 ， 指 定 了 n 和 选项 进行 数值 的 逆序 排序 ， 
并 指定 -k 5 让 sort 程序 使 用 第 5 个 字段 作为 排序 的 关键 值 。 


k 这 个 参数 选项 非常 有 趣 ， 并 且 有 很 多 特性 ， 但 是 首先 我 们 需要 了 解 sort 
是 如 何 定义 字段 的 。 让 我 们 考虑 一 个 非常 简单 的 文本 文件 ， 它 只 有 一 行 ， 并 且 
该 行 只 包含 了 该 作者 的 名 字 。 


William Shotts 


默认 情况 下 , sort 程序 会 把 该 行 看 作 有 两 个 字段 。 第 一 个 字段 包含 “William” 
字符 串 ， 第 二 个 字段 则 是 “Shotts”。 这 意味 着 空白 字符 〈 空 格 和 制 表 符 ) 用 作 
字段 之 间 的 界定 符 ， 并 且 在 排序 时 ， 这 些 界 定 符 是 包括 在 字段 中 的 。 


重新 回 到 前 面 的 1s 例子 ， 我 们 可 以 看 到 ls 的 输出 行 包含 8 个 字段 ， 并 且 第 
5 个 字段 指 的 是 文件 大 小 。 
-rwxr-xr-x 1 root root 8234216 2012-04-07 17:42 inkscape 

让 我 们 考虑 用 下 面 的 文件 。 该 文件 包含 从 2006 年 一 2008 年 三 款 流 行 的 Linux 
发 行 版 的 发 行 历史 。 文 件 每 行 都 有 3 个 字段 : 发行 版 本 名 、 版 本 号 和 MM/DD/ 
YYYY 格式 的 发 行 日 期 。 


SUSE 10.2 12/07/2006 
Fedora 10 11/25/2008 
SUSE 11.0 06/19/2008 
Ubuntu 8.04 04/24/2008 
Fedora 8 11/08/2007 
SUSE 10.3 10/04/2007 
Ubuntu . 6.10 10/26/2006 
Fedora 7 05/31/2007 
Ubuntu 7.10 10/18/2007 
Ubuntu 7.04 04/19/2007 
SUSE 10.1 05/11/2006 
Fedora 6 10/24/2006 
Fedora 9 05/13/2008 
Ubuntu 6.06 06/01/2006 
Ubuntu 8.10 10/30/2008 
Fedora 5 03/20/2006 
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使 用 文本 编辑 器 (可 能 是 vim)， 输 入 此 数据 并 将 其 保存 为 distros.txt。 
接 下 来 ， 我 们 试 着 对 该 文件 进行 排序 并 观察 其 输出 结果 。 


[meelinuxbox ~]$ sort distros.txt 


Fedora 10 11/25/2008 
Fedora 5 03/20/2006 
Fedora 6 10/24/2006 
Fedora 7 05/31/2007 
Fedora 8 11/08/2007 
Fedora 9 05/13/2008 
SUSE 10.1 05/11/2006 
SUSE 10.2 12/07/2006 
SUSE 10.3 .10/04/2007 
SUSE 11.0 06/19/2008 
Ubuntu 6.06 06/01/2006 
Ubuntu 6.10 10/26/2006 
Ubuntu 7.04 04/19/2007 
Ubuntu 7.10 10/18/2007 
Ubuntu 8.04 04/24/2008 
Ubuntu 8.10 10/30/2008 


虽 ， 大 部 分 正确 。Fedora 的 版 本 号 排序 时 却 出 现 了 问题 。 因 为 字符 集中 ， 
字符 1 是 在 字符 5 前 面 的 ， 所 以 导致 版 本 10 位 于 第 一 行 而 版 本 9 却 在 最 后 。 


为 了 解决 这 个 问题 ， 我 们 必须 依据 多 个 键 值 进行 排序 。 首 先 我 们 对 第 一 个 
字段 进行 字母 排序 ， 然 后 再 对 第 三 字段 进行 数值 排序 。sort 支持 -k 选项 的 多 个 
实例 ， 所 以 可 以 指定 多 个 排序 键 值 。 事 实 上 ， 一 个 键 值 可 能 是 一 个 字段 范围 ， 
如 果 没 有 指定 任何 范围 〈《 如 前 面 所 举 的 例子 )，sort 会 使 用 一 个 键 值 ， 该 键 值 始 
于 指定 的 字段 ， 一 直 扩 展 到 行 尾 。 


如 下 便 是 采用 多 键 值 进 行 排序 的 语法 。 


[me@linuxbox ~]$ sort --key=1,1 - -key=2n distros.txt 
Fedora 03/20/2006 


5 
Fedora 6 10/24/2006 
Fedora 7 05/31/2007 
Fedora 8 11/08/2007 
Fedora 9 05/13/2008 
Fedora 10 11/25/2008 
SUSE 10.1 05/11/2006 
SUSE 10.2 12/07/2006 
SUSE 10.3 10/04/2007 
SUSE 11.0 06/19/2008 
Ubuntu 6.06 06/01/2006 
Ubuntu 6.10 10/26/2006 
Ubuntu 7.04 04/19/2007 
Ubuntu 7.10 10/18/2007 
Ubuntu 8.04 04/24/2008 
Ubuntu 8.10 10/30/2008 


虽然 为 了 清晰 ， 我 们 使 用 了 选项 的 长 格式 ， 但 是 -kl1、-k 2n 格式 是 等 价 的 。 
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在 第 一 个 key 选项 的 实例 中 ， 指 定 了 一 个 字段 范围 。 因 为 我 们 只 想 对 第 一 个 字 
段 排 序 ， 所 以 指定 了 “1，1”， 它 意味 着 “ 始 于 并 且 结 束 于 第 一 个 字段 "。 在 第 
二 个 实例 中 ， 我 们 指定 了 2n， 表 示 “ 第 二 个 字段 是 排序 的 键 值 ， 并 且 按 照 数值 
排序 ” 一 个 选项 字母 可 能 包含 在 一 个 键 值 说 明 符 的 末尾 , 用 来 指定 排序 的 种 类 。 
这 些 选 项 字母 与 sort 命令 的 全 局 选项 一 样 : b〈 忽 略 开头 空白 字符 )、n (数值 排 
序 )、r 《逆序 排 序 ) 等 。 


以 上 列表 的 第 三 个 字段 包含 的 日 期 形式 并 不 利于 排序 。 计 算 机 中 ， 日 期 通 
常 以 YYYY-MM-DD 的 形式 存储 ， 以 方便 按时 间 顺 序 排序 ， 但 该 文本 中 的 时 间 
则 是 以 美国 形式 MM/DD/YYYY 存储 。 那 么 ， 该 如 何 对 其 进行 时 间 排 序 呢 ? 

幸好 sort 提供 了 一 种 解决 方法 。sort 的 key 选项 允许 在 字段 中 指定 偏 移 ， 所 
以 我 们 可 以 在 字段 内 定义 键 值 。 


[me@linuxbox ~]$ sort -k 3.7nbr -k 3.4nbr -k 3.4nbr distros.txt 


Fedora 10 11/25/2008 
Ubuntu 8.10 10/30/2008 
SUSE 11.0 06/19/2008 
Fedora 9 05/13/2008 
Ubuntu 8.04 04/24/2008 
Fedora 8 11/08/2007 
Ubuntu 7.10 10/18/2007 
SUSE 10.3 10/04/2007 
Fedora 7 05/31/2007 
Ubuntu 7.04 04/19/2007 
SUSE 10.2 12/07/2006 
Ubuntu 6.10 10/26/2006 
Fedora 6 10/24/2006 
Ubuntu 6.06 06/01/2006 
SUSE 10.1 05/11/2006 


Fedora 5 03/20/2006 


通过 指定 -k 3.7， 我 们 告诉 sort 从 第 三 个 字段 的 第 7 个 字符 开始 排序 ， 也 就 
是 从 年 份 开始 排序 。 同 样 ， 指 定 -k 3.1 和 -k 3.4 选项 以 区 分 日 期 中 的 月 和 日 ， 另 
外 我 们 利用 了 n、r 选项 进行 逆序 数值 排序 。 同 时 添加 的 b 选项 用 来 删除 日 期 字 
段 中 开头 的 空格 〈 行 与 行 之 间 的 空格 字符 数量 不 同 ， 因 此 会 影响 排序 结果 )。 


有 些 文件 并 不 是 使 用 制 表 符 或 空格 符 作 为 字段 定 界 符 ， 例 如 这 个 /etc/passwd 
文件 。 


[me@linuxbox ~]$ head /etc/passwd 
root:x:0:0:root: /root: /bin/bash 
daemon:x:1:1:daemon: /usr/sbin:/bin/sh 
bin:x:2:2:bin: /bin: /bin/sh 
Sys:Xx:3:3:sys:;/dev: /bin/sh 
sync:x:4:65534:sync: /bin: /bin/sync 
games:x:5:60:games: /usr/games: /bin/sh 
man:x:6:12:man: /var/cache/man: /bin/sh 
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1p:x:7:7:1p: /var/spool/lpd: /bin/sh 
mail:x:8:8:mail:/var/mail:/bin/sh 
news:x:9:9:news: /var/spool/news: /bin/sh 


该 文件 的 字段 之 间 以 冒号 (: ) 作为 分 界 符 ， 那么 该 如 何 利用 关键 字段 对 此 
文件 进行 排序 呢 ? sort 提供 了 -t 选项 定义 字段 分 隔 符 ， 根 据 passwd 文件 的 第 7 
个 字段 内 容 进 行 排序 〈 用 户 默认 的 shell 环境 )， 如 下 面 的 命令 行 。 


{me@linuxbox ~]$ sort -t ':' -k 7 /etc/passwd | head 
me:x:1001:1001:Myself,,,:/home/me: /bin/bash 
root:x:0:0:root: /root: /bin/bash 
dhcp:x:101:102::/nonexistent:/bin/false 

gdm:x:106:114:Gnome Display Manager:/var/lib/gdm: /bin/false 
hplip:x:104:7:HPLIP System user,,,:/var/run/hplip: /bin/false 
klog:x:103:104::/home/klog: /bin/false 
messagebus:x:108:119::/var/run/dbus: /bin/false 
polkituser:x:110:122:PolicyKit,,,:/var/run/PolicyKit:/bin/false 
pulse:x:107:116:PulseAudio daemon,,,:/var/run/pulse:/bin/false 


指定 冒号 字符 作为 字段 分 隔 符 , 便 实现 了 依据 第 7 个 字段 进行 排序 的 目的 。 


20.2.3 ”uniq 一 一 通知 或 省 略 重复 的 行 


与 sort 相 比 , uniq 算是 一 个 轻 量 级 命令 。uniq 执行 的 是 一 个 看 似 简单 的 任务 ， 
给 定 一 个 已 排 好 序 的 文件 (包括 标准 输入 〉 后 ，uniq 会 删除 任何 重复 的 行 并 将 结 
果 输 出 到 标准 输出 中 。 它 通常 与 sort 结合 使 用 以 删除 sort 输出 内 容 中 重复 的 行 。 


虽然 uniq 是 一 个 与 sort 一 起 使 用 的 传统 的 UNIX 工具 ， 但 是 GNU 版 本 的 


sort 同样 支持 -u 选项 ， 以 用 于 移 除 sort 输出 内 容 中 的 重复 行 。 


创建 一 个 文本 文件 以 验证 此 特性 。 


[meelinuxbox ~]$ cat > foo.txt 


oyeaogss 


不 要 忘 了 按 下 Ctrl-D 以 结束 标准 输入 。 此 刻 ， 如 果 运 行 uniq， 文 件 内 容 并 
没有 很 大 改动 ， 重 复 的 行 也 并 没有 被 删除 。 


[me@linuxbox ~]$ uniq foo.txt 


Po 
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oo 


uniq 只 有 对 已 经 排 好 序 的 文本 才 有 作用 。 


[me@linuxbox ~]$ sort foo.txt | uniq 
a 
b 
C 


这 是 因为 uniq 只 能 移 除 相 邻 的 重复 行 。 
当然 ，uniq 有 许多 选项 ， 表 20-2 列 出 了 常用 的 一 些 。 
表 20-2 常见 的 uniq 选项 


选项 功能 描述 , 

< 输出 重复 行列 表 ， 并 且 重 复 行 前 面 加 上 其 出 现 的 次 数 

-d 只 输出 重复 行 ， 而 不 包括 单独 行 

-fn 忽略 每 行 前 n 个 字段 。 字 段 之 间 以 空格 分 开 ， 这 与 sort 类 似 , 但 与 sort 不 同 的 是 ， 


uniq 没有 提供 参数 设置 可 选择 的 字段 分 隔 符 

-i 行 与 行 之 间 比 较 时 忽略 大 小 写 
-sn 跳 过 忽略》 每 行 的 前 n 个 字符 
-u 仅 输 出 不 重复 的 行 。 该 选项 是 默认 的 

使 用 uniq 的 -c 选项 ， 可 输出 文本 中 重复 行 的 数量 ， 示 例如 下 。 
[me@linuxbox ~]$ sort foo.txt | uniq -C 

2 a 
2 
2 


b 
C 


20.3 ”切片 和 切 块 


下 面 讨 论 的 3 个 命令 ， 它 们 的 作用 是 剥离 文本 文件 的 列 ， 并 将 它们 以 期 户 
的 方式 重组 。 


20.3.1 ”cut 一 一 删除 文本 行 中 的 部 分 内 容 


cut 命令 用 于 从 文本 行 中 提取 一 段 文字 并 将 其 输出 至 标准 输出 。 它 可 以 接受 
多 个 文件 和 标准 输入 作为 输入 参数 


指定 所 要 提取 的 内 容 ， 实 现 起 来 确实 有 点 别扭 ， 表 20-3 列 出 的 是 指定 时 要 
用 到 的 选项 。 
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表 20-3 cut 选择 选项 


选项 功能 描述 
-c char_list 从 文本 行 中 提取 char_list 定义 的 部 分 内 容 。 此 列表 可 能 会 包含 一 个 或 更 多 冒号 分 开 的 
数值 范围 


-ffield_list 从 文本 行 中 提取 field_list 定义 的 一 个 或 多 个 字段 。 该 列表 可 能 会 包含 由 冒号 分 隔 的 
一 个 、 多 个 字段 或 字段 范围 


-d delim_char ”指定 -f 选 项 后 ， 使 用 delim_char 作为 字段 分 界 符 。 默认 时 ， 字段 必 须 以 单个 Tab 制 表 
符 隔 开 


--complement ”从 文本 中 提取 整 行 ， 除 了 那些 由 -ce 和 /或 -f 指定 的 部 分 


正如 大 家 所 看 到 的 ，cut 提取 文本 的 方式 非常 不 灵活 。ecut 适合 从 其 他 命令 
的 输出 结果 中 提取 文本 内 容 ， 而 不 是 直接 从 输入 文本 中 提取 。 我 们 可 以 判断 下 
面 的 distros.txt 文件 是 否 达 到 了 cut 的 提取 要 求 ， 利 用 cat 的 -A 选项 ， 可 以 检查 
该 文件 是 否 用 Tab 作为 字段 分 隔 符 的 。 


[me@linuxbox ~]$ cat -A distros.txt 
SUSE*I10.2^I112/07/2006$ 
Fedora^I10^I11/25/2008$ 
SUSE^I11.0^I06/19/2008$ 
Ubuntu”^18.04^104/24/2008$ 
Fedora“18“^I111/08/2007$ 
SUSE^I10.3^I1010412007$ 
Ubuntu^I6.10*I10/26/12006$ 
Fedora^I7^I05/31/12007$ 
Ubuntu^I7.10^I1011812007$ 
Ubuntu^I7.04^I0414912007$ 
SUSE^I10.1^I05/1111/2006$ 
Fedora^I6^I101/24/2006$ 
Fedora“19^105/13/2008$ 
Ubuntu^I6.06^I06/01/12006$ 
Ubuntu^I8.10^I101/30/12008$ 
Fedora^15^103/20/2006$ 


看 起 来 不 错 一 一 没有 内 媒 空 格 ， 字 段 之 间 仅 仅 只 有 单个 的 制 表 符 。 鉴 于 文 
件 使 用 的 是 制 表 符 而 不 是 空格 ， 所 以 可 以 使 用 -选项 提取 字段 内 容 


[me@linuxbox ~]$ cut -f 3 distros.txt 
12/07/2006 
11/25/2008 
06/19/2008 
04/24/2008 
11/08/2007 
10/04/2007 
10/26/2006 
05/31/2007 
10/18/2007 
04/19/2007 
05/11/2006 
10/24/2006 
05/13/2008 
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06/01/2006 
10/30/2008 
03/20/2006 


由 于 distros 文件 是 以 制 表 符 作为 分 界 符 的 ， 所 以 用 cut 提取 字段 而 不 是 字符 
再 合适 不 过 。 这 是 因为 用 Tab 作为 分 界 符 的 文件 ， 一 般 每 行 不 会 包含 相同 的 字符 
数 ， 所 以 计算 字符 在 行内 的 位 置 很 困难 或 是 根本 不 可 能 。 然 而 在 上 例 中 ， 我 们 已 
经 提取 好 了 包含 相同 长 度数 据 的 字段 ， 从 而 可 以 拿 此 字段 作为 字符 提取 实例 。 


[me@linuxbox ~]$ cut -f 3 distros.txt | cut -¢ 7-10 
2006 
2008 
2008 
2008 
2007 
2007 
2006 
2007 
2007 
2007 
2006 
2006 
2008 
2006 
2008 
2006 


对 输出 结果 再 进行 一 次 cut 操作 , 便 可 以 将 字段 中 与 年 份 相对 应 的 第 7 至 第 
10 个 字符 提取 出 来 , 命令 行 中 的 符号 “7-10” 指 范围 。cut 的 man 手册 页 包含 了 
关于 范围 指定 的 完整 描述 。 


当 处 理 字 段 时 ， 我 们 可 以 指定 非 Tab 字符 作为 分 界 符 。 Ta 
示 的 是 从 /etc/passwd 文件 中 提取 了 每 行 的 第 一 个 字段 。 


[meelinuxbox ~]$ cut -d ':' -f 1 /etc/passwd | head 
root 
daemon 
bin 
SYS 
Sync 
games 
man 

1p 
mail 
news 


此 处 我 们 还 使 用 了 -d 选项 指定 冒号 作为 字段 的 分 界 符 。 


扩展 制 表 符 Tab 
上 例 中 的 distros.txt 文件 已 经 被 格式 化 为 cut 提取 最 理想 的 形式 。 但 是 如 
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果 想 要 一 个 可 以 完全 由 cut 借助 字符 ， 而 非 字段 执行 提取 操作 的 文件 ,该 怎么 
办 呢 ? 这 就 需要 我 们 将 文件 中 的 Tab 符号 置换 成 等 长 的 空格 符号 。 幸运 的 是 ， 
GNU 的 coreutils 软件 包 提供 了 expand 这 样 一 个 工具 ,该 命令 的 输入 参数 既 可 
以 是 标准 输入 也 可 以 是 一 至 多 个 文件 ， 改 动 后 的 文本 会 以 标准 形式 输出 。 

如 果 事 先 用 expand 处 理 distros.txt 文件 ， 便 可 以 直接 用 cut -c 从 文件 中 提取 
任意 范围 的 字符 。 示 例如 下 ,通过 expand 扩展 该 文件 后 , 使 用 cut 提取 文本 行 
从 第 23 个 到 末尾 的 字符 ， 这 样 ， 我 们 便 单 独 提 取出 了 发 行 年 份 这 一 列表 栏 。 

[me@linuxbox ~]$ expand distros.txt | cut -C 23- 

另外 ，coreutils 软件 包 同 样 也 提供 了 unexpand 命令 ， 从 而 用 空格 取代 了 

制 表 符 。 


20.3.2 ”paste 一 一 合并 文本 行 


paste 命令 是 cut 的 逆 操 作 ， 它 不 是 从 文本 文件 中 提取 列 信息 ， 而 是 向 文件 中 增 
加 一 个 或 是 更 多 的 文本 列 。 该 命令 读 取 多 个 文件 并 将 每 个 文件 中 提取 出 的 字段 结合 
为 一 个 整体 的 标准 输出 流 。 与 cut 类 似 ，paste 也 可 以 接受 多 个 文件 输入 参数 和 标准 
输入 。 至 于 paste 是 如 何 运行 的 ， 我 们 可 以 通过 下 面 的 例子 进行 了 解 。 如 下 所 示 ， 我 
们 描述 了 一 个 使 用 paste 对 distros.txt 文件 按照 发 行 版 本 的 时 间 顺 序 而 排序 的 例子 。 

首先 ， 我 们 用 前 面 所 学 的 sort 命令 ， 得 到 一 个 依据 日 期 进行 排序 的 distros 
列表 ， 并 将 输出 结果 储存 于 文件 distros-by-date.txt 中 。 


[me@linuxbox ~]$ sort -k 3.7nbr -k 3.1nbr -k 3.4nbr distros.txt > distros-by- 
date.txt 


接 下 来 , 我 们 使 用 cut 提取 文件 中 前 两 个 字段 (distros 的 名 字 和 发 行 版 本 )， 
并 将 结果 存 于 文件 distro-versions.txt 中 。 


[meelinuxbox ~]$ cut -f 1,2 distros-by-date.txt > distros-versions.txt 
[meelinuxbox -]$ head distros-versions.txt 


Fedora 10 
Ubuntu 8.10 
SUSE 11.0 
Fedora 9 
Ubuntu 8.04 
Fedora 8 
Ubuntu 7.10 
SUSE 10.3 
Fedora 7 
Ubuntu 7.04 


最 后 一 步 准备 工作 就 是 提取 发 行 版 本 日 期 , 并 将 结果 存 于 distro-dates.txt 文 
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件 中 。 


[meelinuxbox ~]$ cut -f 3 distros-by-date.txt > distros-dates.txt 
[meelinuxbox ~]$ head distros-dates.txt 
11/25/2008 

10/30/2008 

06/19/2008 

05/13/2008 

04/24/2008 

11/08/2007 

10/18/2007 

10/04/2007 

05/31/2007 

04/19/2007 


此 刻 ， 万 事 俱 备 ， 只 从 东风 。 作 为 整个 例子 的 最 后 一 步 ， 我 们 使 用 paste 将 
提取 的 日 期 这 一 列 内容 置 于 distro 中 操作 系统 名 称 和 发 行 版 本 号 这 两 列 之 前 ,于 
是 便 生 成 了 一 个 按时 间 顺 序 排列 的 发 行 版 本 列表 。 这 一 过 程 只 是 简单 地 使 用 
paste 命令 来 将 各 参数 按照 指定 顺序 进行 排列 。 


[me@linuxbox ~]$ paste distros-dates.txt distros-versions.txt 


11/25/2008 Fedora 

10/30/2008 Ubuntu 8.10 
06/19/2008 SUSE 11.0 
05/13/2008 Fedora 9 
04/24/2008 Ubuntu 8.04 
11/08/2007 Fedora 8 
10/18/2007 Ubuntu 7.10 
10/04/2007 SUSE 10.3 
05/31/2007 Fedora 7 
04/19/2007 Ubuntu 7.04 
12/07/2006 SUSE 10.2 
10/26/2006 Ubuntu 6.10 
10/24/2006 Fedora 6 
06/01/2006 Ubuntu 6.06 
05/11/2006 SUSE 10.1 
03/20/2006 Fedora 5 


20.3.3 join 一 一 连接 两 文件 中 具有 相同 字段 的 行 


从 某 种 程度 上 来 说 ，join 与 paste 类 似 ， 因 为 它 也 是 向 文件 增加 列 信息 ， 只 
是 实现 方式 有 些许 不 同 。“join” 操 作 通常 与 “关联 数据 库 ” 联 系 在 一 起 ， 它 在 
关联 数据 库 中 把 共享 关键 字段 多 个 表格 的 数据 组 合成 一 个 期 望 结果 。“join” 是 
一 个 基于 共享 关键 字段 将 多 个 文件 的 数据 拼接 在 一 起 的 操作 。 


至 于 “join” 命 令 在 关联 数据 库 中 是 如 何 操 作 的 ， 我 想 大 家 一 定 想 知道 。 示 例如 
下 ， 假 定 有 一 个 比较 小 的 包含 两 个 表格 的 数据 库 ， 并 且 每 个 表格 都 只 包含 一 项 纪录 。 
第 一 个 表格 ， 叫 做 CUSTOMERS， 它 有 三 个 字段 ， 分 别 是 顾客 号 码 (CUSTNUM)， 
顾客 的 姓 (FENAME) 以 及 顾客 的 名 (LNAME )。 
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4681934 


第 二 个 表格 叫做 ORDERS, 包含 4 个 字段 , 它们 是 订单 号 (ORDERNUM)、 
顾客 号 码 (CUSTNUM)、 数 量 (QUAN) 以 及 订购 内 容 (ITEM)。 


ORDERNUM 


3014953305 


CUSTNUM 


4681934 


Blue Widget 


请 注意 ， 两 个 表格 拥有 公共 字段 CUSTNUM。 这 很 重要 ， 因 为 这 就 是 两 个 
表格 之 间 的 联系 。 


join 操作 完成 了 两 个 表格 中 的 字段 结合 ， 从 而 得 到 了 有 用 的 输出 结果 ， 诸 
如 用 于 准备 一 张 发 票 ,利用 两 个 表格 中 CUSTNUM 字段 的 共有 匹配 值 , 进行 join 


操作 后 便 会 输出 以 下 结果 。 
FNAME LNAME 
Jom smith 


ITEM 


Blue Widget 


做 为 演示 ， 我 们 需要 创建 两 个 具有 共有 字段 的 文件 ， 于 是 便 可 以 使 用 distros- 
by-date.txt 文件 。 利 用 该 文件 ， 可 以 生成 两 个 附属 文件 ， 其 中 一 个 文件 包含 的 内 
容 是 发 行 时 间 《 作 为 本 例 中 的 共有 字段 } 和 发 行 版 本 名 。 


[meelinuxbox ~]$ cut -f 1,1 distros-by-date.txt > distros-names.txt 
[meelinuxbox ~]$ paste distros-dates.txt distros-names.txt > distros-key-names 


txt 


[me@linuxbox ~]$ head distros-key-names .txt 


11/25/2008 
10/30/2008 
06/19/2008 
05/13/2008 
04/24/2008 
11/08/2007 
10/18/2007 
10/04/2007 
05/31/2007 
04/19/2007 


Fedora 
Ubuntu 
SUSE 

Fedora 
Ubuntu 
Fedora 
Ubuntu 
SUSE 

Fedora 
Ubuntu 


第 二 个 文件 的 内 容 则 包含 发 行 时 间 和 发 行 版 本 号 。 


[me@linuxbox ~]$ cut -f 2,2 distros-by-date.txt > distros-vernuns.txt 
[me@linuxbox ~]$ paste distros-dates.txt distros-vernums.txt > distros-key- 


Vernums .txt 


[me@linuxbox ~]$ head distros-key-vernums.txt 


11/25/2008 
10/30/2008 
06/19/2008 
05/13/2008 


第 20 章 文本 处 理 245 


04/24/2008 8.04 
11/08/2007 8 
10/18/2007 7.10 
10/04/2007 10.3 
05/31/2007 7 


04/19/2007 7.04 


此 刻 ， 两 个 具有 公共 字段 (“发行 时 间 ” 作 为 共有 字段 ) 的 文件 便 准 备 妥 当 。 
此 处 需要 重点 强调 的 是 ， 文 件 必须 事先 依据 共有 关键 字段 排 好 序 ， 因 为 只 有 这 
样 join 才能 正常 工作 。 
[me@linuxbox ~]$ join distros-key-names.txt distros-key-vernunms .txt | head 
11/25/2008 Fedora 10 
10/30/2008 Ubuntu 8.10 
06/19/2008 SUSE 11.0 
05/13/2008 Fedora 9 
04/24/2008 Ubuntu 8.04 
11/08/2007 Fedora 8 
10/18/2007 Ubuntu 7.10 
10/04/2007 SUSE 10.3 
05/31/2007 Fedora 7 
04/19/2007 Ubuntu 7.04 


同样 请 注意 ， 默 认 情 况 下 ，join 会 把 空格 当 作 输入 字段 的 分 界 符 ， 而 以 单 
个 空格 作为 输出 字段 的 分 界 符 ， 当 然 我 们 也 可 以 通过 指定 参数 选项 改变 这 一 默 
认 属 性 。 我 们 可 以 查看 join 的 man 手册 页 获取 更 详细 信息 。 


20.4 文本 比较 


比较 文本 文件 的 版 本 号 通常 很 有 用 ， 尤 其 对 系统 管理 者 以 及 软件 开发 者 而 
言 。 例 如 ， 一 个 系统 的 管理 者 可 能 需要 将 已 存在 的 配置 文件 与 原先 的 配置 文件 
相 比 较 ， 以 检查 出 系统 漏洞 ， 与 此 类 似 ， 程 序 员 也 会 经 常 需要 查看 程序 代码 所 
经 历 的 变化 。 


20.4.1 ”comm 一 一 逐 行 比较 两 个 已 排序 文件 


comm 命令 一 般 用 于 文本 文件 之 间 的 比较 , 显示 两 文件 中 相 异 的 行 以 及 相同 
的 行 。 作 为 演示 ， 我 们 首先 利用 cat 生成 两 个 近乎 一 样 的 文本 文件 。 


[me@linuxbox ~]$ cat > file1.txt 
a 


b 
c 
d 
Ime@linuxbox ~]$ cat > file2.txt 
b 
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已 个 


接 下 来 ， 便 利用 comm 比较 两 个 文件 的 差异 。 


[me@linuxbox ~]$ comm filei1.txt file2.txt 
” b 
e . 
从 以 上 结果 可 以 看 出 ，comm 输出 了 三 列 内 容 。 第 一 列 显 示 的 是 第 一 个 文件 
中 独 有 的 行 ， 第 二 列 显 示 的 是 第 二 个 参数 文件 中 独 有 的 行 ， 第 三 列 显示 的 则 是 
两 个 文件 所 共有 的 行 。comm 还 支持 -n 形式 的 参数 选项 ， 此 处 的 n 可 以 是 1、2 
或 者 3, 使 用 时 ， 它 表示 省 略 第 n 列 的 内 容 。 例如， 如 果 只 想 显 示 两 个 文件 的 共 


有 行 ， 便 可 以 省 略 第 1 列 和 第 2 列 的 内 容 ， 示 例如 下 。 
[meelinuxbox -~1$ comg -12 fiLe1.txt file2.txt 
b 


C 
d 


20.4.2 diff 一 一 未 行 比较 文件 


与 comm 命令 类 似 ，di 企 用 于 检测 文件 之 闻 的 不 同 。 然 而 ，di 企 比 comm 更 
复杂 ， 它 支持 多 种 输出 形式 ， 并 且 具 备 一 次 性 处 理 大 文件 集 的 能 力 。di 企 通常 被 
软件 开发 者 用 于 检查 不 同 版 本 的 源 代码 之 间 的 差异 ， 因 为 它 能 够 递归 检查 源 代 
码 目录 《通常 称 为 源 树 )。diff 的 常见 用 法 就 是 创建 di 任 文件 和 补丁 ， 它 们 可 以 
为 诸如 patch (后 面 将 会 深入 讨论 ) 这 样 的 命令 所 用 ， 从 而 实现 一 个 版 本 的 文件 
更 新 为 另 一 个 版 本 。 


将 diff 运用 于 前 面 例子 中 使 用 到 的 文件 ， 我 们 会 发 现 其 默认 形式 的 输出 结 
果 其 实 是 对 两 者 文件 差异 的 一 个 简洁 描述 。 
[me@linuxbox -]$ diff filel1.txt file2.txt 
1d0 


4a4 
> e 


默认 形式 中 ， 每 一 组 改动 的 前 面 都 有 一 个 以 “范围 ”执行 操作 ”范围 ” 形 
式 (range operation range) 表示 的 改变 操作 命令 ( 见 表 20-4)， 该 命令 会 告诉 程 
序 对 第 一 个 文件 的 某 个 位 置 进行 某 种 改变 ， 便 可 实现 与 第 二 个 文件 内 容 一 致 。 
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表 20-4 di 任 改 变 命令 


改变 操作 功能 描述 

rlar2 将 第 二 个 文件 中 2 位置 的 行 添加 到 第 一 个 文件 中 的 位 置 rl 处 

rlcr2 用 第 二 个 文件 2 处 的 行 替代 第 一 个 文件 rl 处 的 行 

rldr2 删除 第 一 个 文件 rl 处 的 行 ， 并 且 删 除 的 内 容 作为 第 二 个 文件 忆 行 范围 的 内 容 


此 格式 中 ,范围 range 一 般 是 由 冒号 隔 开 的 起 始 行 和 末尾 行 组 成 。 虽然， 此 
格式 是 默认 的 (大 多 数 情况 下 是 为 了 兼容 POSIX 的 同时 向 后 兼容 传统 UNIX 版 
本 的 dif)， 但 它 并 没有 其 他 格式 的 应 用 广泛 ， 上 下 文 格式 和 统一 格式 才 是 比较 
普遍 使 用 的 格式 。 


上 下 文 格式 的 输出 结果 如 下 。 


[me@linuxbox ~]$ diff -C file1.txt file2.txt 

** file1.txt 2012-12-23 06:40:13.000000000 -0500 
-- file2.txt 2012-12-23 06:40:34.000000000 -0500 
李 李 本 字 丰 丰 本 让 不下 中 让 中 本本 

让 丰 中 1,4 定 字 本 丰 


该 结果 以 两 个 文件 的 名 字 和 时 间 信 息 开头 ， 第 一 个 文件 用 星 号 表示 ， 第 二 
个 文件 用 破 折 号 表示 。 输 出 结果 的 其 余部 分 出 现 的 星 号 和 破 折 号 则 分 别 表示 各 
自 所 代表 的 文件 。 其 他 的 内 容 便 是 两 个 文件 之 间 的 差异 组 ， 包 括 文本 的 默认 行 
号 。 第 一 组 差异 ， 以 *** 1,4 *##* 开 头 ， 表 示 第 一 个 文件 中 的 第 1 行 至 第 4 行 ; 
第 二 组 便 以 --- 1,4 ---- 开 头 ,表示 第 二 个 文件 的 第 1 行 至 第 4 行 。 每 个 差异 组 的 
行 都 是 以 如 下 四 个 标识 符 之 一 开头 ， 见 表 20-5。 


表 20-5 diff 上下文 格式 差异 标识 符 


标示 符 含义 

(无 ) 该 行 表示 上 下 文 文本 。 表 示 两 个 文件 共有 的 行 

a 缺少 的 行 。 指 此 行内 容 只 在 第 一 个 文件 中 出 现 ， 第 二 个 文件 中 则 没有 
+ 多 余 的 行 。 此 行内 容 只 有 第 二 个 文件 才 有 ， 第 一 个 文件 则 没有 


! 改变 的 行 。 两 个 版 本 的 行内 容 都 会 显示 出 来 ,每 一 个 都 各 自 出 现在 差异 组 中 相应 的 部 分 
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统一 格式 与 上 下 文 格式 相似 但 是 更 简明 ， 此 格式 用 -u 选项 指定 。 


[me@linuxbox -]$ diff -u file1.txt file2.txt 

-- 下 ilLe1.txt 2012-12-23 06:40:13.000000000 -0500 
+++ file2.txt 2012-12-23 06:40:34.000000000 -0500 
ee -1,4 +1,4 Be 


上 下 文 格式 和 统一 格式 之 间 最 显著 的 区 别 就 是 ， 统 一 格式 下 没有 重复 的 文 
本 行 ， 这 使 得 统一 格式 的 输出 结果 比 上 下 文 格式 的 精简 。 上 例 中 ， 也 输出 了 上 
下 文 格式 中 出 现 的 文件 时 间 信 息 ， 并 且 后 面 紧 跟着 “@@ -1,4 +1,4 @@” 字 符 
串 ， 它 表示 差异 组 中 描述 的 两 个 文件 各 自 的 行 范围 。 此 字符 串 之 后 便 是 行 本 身 ， 
其 中 包含 默认 的 三 行文 本 内 容 。 正 如 表 20-6 所 示 ， 每 一 行 都 以 下 面 的 三 个 可 能 


的 标示 符 开 头 。 

表 20-6 di 任 统一 格式 的 差异 标示 符 

字符 含义 

(无 ) 两 个 文件 共有 的 行 

- 相对 于 第 二 个 文件 而 言 ， 第 一 个 文件 中 没有 的 行 
第 一 个 文件 多 余 的 行 


20.4.3 ”patch 一 一 对 原文 件 进行 diff 操作 


patch 命令 用 于 更 新 文本 文件 。 它 利用 di 任命 令 的 输出 结果 将 较 旧版 本 的 文 
件 升级 成 较 新 版 本 。 下 面 看 一 个 众所周知 的 例子 ，Linux 内 核 是 由 一 个 很 大 的 、 
组 织 松散 的 志愿 者 团队 开发 的 ， 其 源 代码 处 于 持续 不 断 更 新 中 。Linux 内 核 包 含 
几 百 万 行 代码 ， 所 以 相 比 而 言 ， 某 位 开发 成 员 每 次 所 做 的 改变 是 如 此 微不足道 。 
因此 ， 对 于 每 位 开发 者 来 说 ， 每 对 代码 改动 一 次 就 得 向 其 他 开发 者 发 送 整个 内 
核 源 代码 树 是 多 么 不 切实 际 。 事 实 上 ， 一 般 只 要 发 送 diff 补丁 文件 即 可 ，diff 
补丁 的 内 容 是 内 核 从 较 旧 版 本 转变 为 较 新 版 本 所 经 历 的 改变 ， 接 收 者 然后 使 用 
patch 命令 将 这 些 改变 应 用 于 其 自身 的 源 代码 树 。difppatch 有 两 个 重要 的 优点 。 


。 与 源 代 码 树 的 大 小 相 比 ，di 企 文件 很 小 。 
。 diff 文件 非常 简洁 地 描述 了 文件 所 做 的 改变 ， 便 于 补丁 的 接收 者 快速 对 其 
进行 评价 。 
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当然 ，difppatch 不 仅仅 局 限于 源 代码 ， 它 适用 于 任何 文本 文件 。 因 此 ， 它 
同样 适用 于 配置 文件 以 及 其 他 文本 文件 。 

生成 供 patch 使 用 的 di 在 文件 ，GNU 文件 系统 建议 采用 如 下 方式 使 用 diff。 
diff -Naur oldg file new file > diff file 

此 处 old_ file 和 new_ file 既 可 以 是 单独 的 文件 也 可 以 是 包含 文件 的 目录 , 使 
用 -r 参数 选项 则 是 为 了 进行 递归 目录 树 搜索 。 

一 旦 创建 了 di 全 文件 ， 便 可 以 将 其 用 于 修补 原文 件 old_ fle， 从 而 升级 为 新 
文件 new_file: 
patch < diff file 

以 前 面 的 测试 文件 为 例 : 
[me@linuxbox ~]$ diff -Naur filel1.txt file2.txt > patchfile.txt 
[me@linuxbox ~]$ patch < patchfile.txt 
patching file filet.txt 
Imeelinuxbox ~]$ cat file1.txt 


C 
d 
e 


本 例 中 ， 我 们 创建 了 一 个 叫做 patchfile.txt 的 diff 文件 ， 然 后 使 用 patch 命 
令 进 行 修补 。 请 注意 该 命令 行 中 ， 并 没有 给 patch 命令 指定 目标 文件 ， 因 为 di 人 
文件 (统一 形式 ) 已 经 在 页 导 中 包含 了 文件 名 。 可 以 发 现 ， 进行 修补 后 , filel.txt 
便 与 fille2.txt 一 致 了 。 


patch 有 很 多 参数 选项 ， 而 且 有 很 多 额外 的 工具 命令 可 以 分 析 并 编辑 这 些 补 
丁 文件 。 


20.5” 非 交互 式 文 本 编辑 


之 前 所 描述 的 文本 编辑 大 多 都 是 交互 式 的 ， 也 就 是 说 只 要 手动 移动 鼠标 然 
后 输入 需要 进行 的 改变 ， 然 而 ， 也 可 以 用 非 交 互 的 方式 进行 文本 编辑 。 例 如 ， 
可 以 只 用 一 个 简单 的 命令 一 次 性 更 改 多 个 文件 。 


20.5.1 tr 一 一 替换 或 删除 字符 


tr 是 替换 字符 命令 ， 可 以 将 其 看 作 一 种 基于 字符 的 查找 和 替换 操作 。 所 谓 
替换 ， 实 际 是 指 将 字符 从 一 个 字母 更 换 为 其 他 字母 。 例 如 ， 将 小 写字 母 转变 为 
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大 写字 母 。 如 下 便 是 一 个 利用 女 进 行 大 小 写字 母 蔡 换 的 例子 。 


[meelinuxbox ~]$ echo "lowercase letters" | tr a-z A-Z 
LOWERCASE LETTERS 


该 输出 结果 表明 ，tr 可 对 标准 输入 进行 操作 并 且 将 结果 以 标准 形式 输出 。tr 
有 两 个 参数 ， 等 待 转换 的 字符 集 和 与 之 相对 应 的 蔡 换 字符 集 。 字 符 集 的 表示 方 
法 可 以 是 下 面 三 种 方式 中 的 任 一 种 。 
。 枚 举 列表 ; 例如 ，ABCDEFGHIJKLMNOPQRSTUVWXYZ。 


。 字符 范围 ， 例 如 ，A-Z。 请 注意 ， 这 种 方法 有 时 会 与 其 他 命令 一 样 受 限于 
同一 个 问题 〈 由 于 不 同系 统 的 排序 顺序 )， 因 此 使 用 时 要 小 心 。 


。 POSIX 字符 类 ; 例如，[:upper:]。 


多 数 情况 下 ， 这 两 个 字符 集 应 该 是 同等 长 度 ， 然 而 ， 第 一 个 字符 集 比 第 二 
个 字符 集 长 也 是 可 能 的 ， 如 下 便 是 一 个 将 多 个 字符 替换 为 单个 字符 的 例子 。 


[me@linuxbox ~]$ echo “lowercase letters" | tr [:liower:] A 
AAAAAAAAA AAAAAAA 


除了 替换 ,tr 还 可 以 直接 从 输入 流 中 删除 字符 本章 前 篇 ,讨论 了 将 MS-DOS 
类 型 的 文本 文件 向 UNIX 类 型 转换 的 问题 。 要 进行 这 样 的 转换 ， 需 要 移 除 每 行 
末尾 的 回 车 符 ， 如 此 便 可 以 用 tr 命令 解决 ， 如 下 所 示 。 


tr -d '\r' < gos file > unix file 


这 里 的 dos_file 是 待 转换 的 文件 ， 而 UNIX_file 则 是 转换 的 结果 文件 。 此 命 
令 形式 使 用 了 转 义 字符 \r 代替 回 车 符 。 如 若 想 了 解 tr 支持 的 所 有 转 义 符号 和 字 
符 类 ， 请 查看 tr 的 帮助 手册 。 


[me@linuxbox ~]$ tr ~heip 


ROT13: 保密 性 不 强 的 编码 环 
tr 的 一 个 有 趣 用 法 就 是 可 以 进行 ROT13 文本 编码 . ROT13 是 一 种 基于 简 
单 替换 算法 的 加 密 方 式 。ROT13 这 个 名 字 有 点 抽象 ,“ 文 本 模糊 ”应 该 更 具体 
一 点 。 在 文本 中 应 用 该 加 密 方 式 ， 有 时 是 为 了 隐藏 潜在 的 攻击 性 内 容 。 该 方 
法 仅仅 是 将 每 个 字母 在 字母 表 中 向 上 移动 了 13 位 ， 由 于 正好 移动 了 字母 表 中 
字母 总 数 26 的 一 半 , 所 以 再 执行 一 次 此 算法 文本 便 可 以 恢复 原样 . 示例 如 下 ， 
使 用 tr 进行 编码 。 


echo "secret text” | tr a-zA-Z n-za-mN-ZA-M 
frperg grkg 
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再 进行 一 次 同样 的 步骤 即 得 到 了 译 码 如 采 : 


echo "frperg grkg" | tr a-zA-Z n-za-mN-ZA-M 
secret text 


许多 email 程序 以 及 Usenet 新 闻 阅 读 器 都 支持 ROT13 编码 。 维 基 百 科 上 有 一 
篇 关于 该 主题 的 很 好 的 文章 , 大 家 有 兴趣 的 可 以 看 一 看 , 网 址 为 : http://en.wikipedia. 
org/wiki/ROTI3. 


tr 还 有 另外 一 个 奇妙 的 用 法 。 使 用 -s 选项 ，tr 可 以 “挤兑”( 删 除 ) 重 复出 
现 的 字符 ， 示 例如 下 。 


[mealinuxbox ~]$ echo “aaabbbccc" | tr -s ab 
abccc 


本 例 字 符 串 中 含有 重复 字符 ， 通 过 给 tr 指定 ab 字符 集 ， 便 消除 了 该 字符 集 
中 重复 的 “a” 和 “b” 字 母 ， 而 字母 c 并 没有 改变 ， 因 为 tr 设 定 的 字符 集中 并 
没有 包含 c。 请 注意 重复 的 字符 必须 是 毗邻 的 ， 否 则 该 挤兑 操作 将 不 起 作用 。 


[me@linuxbox ~]$ echo “abcabcabc"” | tr -s ab 
abcabcabc 


20.5.2 ”sed 一 一 用 于 文本 过 滤 和 转换 的 流 编 辑 器 


sed 是 stream ediior 〈 流 式 编辑 器 ) 的 缩写 ， 它 可 以 对 文本 流 、 指 定 文件 集 
或 标准 输入 进行 文本 编辑 。sed 功能 非常 强大 ， 并 且 从 某 种 程度 上 来 说 ， 它 还 是 
一 个 比较 复杂 的 命令 (有 整 本 书 的 内 容 对 它 进 行 了 讲解 )， 所 以 本 书 无 法 涉及 其 
所 有 用 法 。 

sed 的 用 法 ， 总 得 来 说 ， 首 先 给 定 sed 某 个 简单 的 编辑 命令 《在 文本 行 中 ) 
或 是 包含 多 个 命令 的 脚本 文件 名 ， 然 后 sed 便 对 文本 流 的 内 容 执行 给 定 的 编辑 
命令 。 下 面 是 一 个 非常 简单 sed 应 用 实例 。 


[meelinuxbox ~]$ echo "front" | sed 's/front/back/ 
back 


该 例 先 利用 echo 生成 了 只 包含 一 个 单词 的 文本 流 ， 然 后 将 该 文本 流 交 给 
sed 处 理 ， 而 sed 则 对 文本 流 执行 s/front/back/ 指 令 ， 最 后 输出 “back” 作 为 
运行 结果 。 所 以 可 以 认为 ， 本 例 中 的 sed 与 vi 中 的 替代 (查找 与 替换 ) 命令 
相似 。 


sed 中 的 命令 总 是 以 单个 字母 开头 。 上 例 中 ， 蔡 换 命令 便 由 字母 s 代替， 其 
后 紧 跟 替 换 字符 ， 替 换 字符 由 作为 分 界 符 的 斜 线 字符 分 开 。 分 界 符 的 选择 是 随 
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意 的 ， 习 惯 上 一 般 使 用 斜 线 ， 但 是 sed 支持 任意 字符 作为 分 界 符 ，sed 会 默认 紧 
跟 在 sed 的 命令 之 后 的 字符 为 分 界 符 。 下 面 的 命令 行 能 得 到 相同 的 效果 。 


{me@linuxbox ~]$ echo “front" | sed 's_front back_' 
back 


由 于 下 划 线 是 紧 跟 在 命令 字符 “s” 之 后 的 ， 所 以 它 便 是 分 界 符 。 由 此 可 见 ， 
这 种 自动 设 定 分 界 符 的 能 力 增强 了 命令 行 的 可 读 性 。 


sed 中 的 多 数 命 令 允 许 在 其 前 添加 一 个 地 址 , 该 地 址 用 来 指定 输入 流 的 哪 一 
行 被 编辑 。 如 果 该 地 址 省 略 了 ， 便 会 默认 对 输入 流 的 每 一 行 执行 该 编辑 命令 。 
最 简单 的 地 址 形式 就 是 一 个 行 号 。 例 如 ， 在 上 例 中 增加 一 个 “1?”， 如 下 所 示 。 


[me@linuxbox ~]$ echo “front" | sed '1s/front/back/， 
back 


增加 的 “1” 表 示 此 替换 操作 只 对 输入 流 的 第 一 行 起 作用 。 当 然 也 可 以 指定 
其 他 行 号 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo "front" | sed '2s/front/back/' 
front 


结果 显示 此 替换 操作 并 未 执行 ， 这 是 因为 该 输入 流 中 并 没有 第 二 行 。 地 址 
可 以 有 多 种 方式 表达 ， 表 20-7 列 出 了 最 常用 的 几 个 。 


表 20-7 sed 的 地 址 表达 法 


地 址 功能 说 明 
N n 是 正 整 数 表示 行 号 
$ 最 后 一 行 


用 POSIX 基本 正则 表达 式 描 述 的 行 。 请 注意 ， 这 里 的 正则 表达 式 用 的 是 斜 线 作 为 分 界 
/regexp/ 符 ， 当 然 ， 也 可 以 自己 选择 分 界 符 ， 只 要 用 \eregexpe 选项 指定 即 可 ， 这 里 的 c 就 是 用 于 
取代 斜 杠 的 分 界 符 


addrl,addr2 ” 行 范围 ， 表 示 从 addrl 至 addr2 的 所 有 行 。 地 址 可 以 是 上 面 所 述 形式 的 任何 一 种 


代表 行 号 从 first 行 开 始 ， 以 step 为 间隔 的 所 有 行 。 例 如 ，1 一 2 是 指 所 有 奇数 行 ， 而 5 一 
5 是 指 第 5 行 和 以 及 随后 的 所 有 是 $ 的 倍数 的 行 


addrl,+n addrl 行 及 其 之 后 的 n 行 
addr! 出 了 addr 行 之 外 的 所 有 行 ，addr 可 以 用 上 面 的 任何 一 种 形式 表达 


first~step 


接 下 来 , 我 们 会 用 本 章 前 面 所 使 用 的 distros.txt 文件 演示 多 种 不 同形 式 的 地 
址 表达 。 首 先 ， 用 行 号 范围 的 表达 方式 如 下 所 示 。 


[me@linuxbox ~]$ sed -n '1,5p' distros.txt 
SUSE 10.2 12/07/2006 


Fedora 
SUSE 

Ubuntu 
Fedora 
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10 11/25/2008 
11.0 06/19/2008 
8.04 04/24/2008 
8 11/08/2007 


此 例 显 示 了 distros.txt 文件 中 第 1 行 到 第 5 行 的 内 容 , 利用 了 p 命令 输出 指 
定 匹 配 行 的 内 容 ， 从 而 完成 上 述 操 作 。 然 而 ， 要 想得到 正确 结果 ， 就 必须 添加 
选项 -n 〈 不 会 自动 打印 选项 》 以 防 sed 会 默认 输出 每 一 行 的 内 容 。 


下 面 尝试 使 用 正则 表达 式 。 


[meelinuxbox ~]$ sed -n '/SUSE/p' distros.txt 


SUSE 
SUSE 
SUSE 
SUSE 


10.2 12/07/2006 
11.0 06/19/2008 
10.3 10/04/2007 
10.1 05/11/2006 


此 处 用 的 是 以 斜 杠 隔 开 的 正则 表达 式 /SUSE/， 查 找 包含 SUSE 字符 串 的 文 
本 行 ， 该 用 法 与 grep 的 用 法 类 似 。 
最 后 ， 尝 试 在 地 址 前 添加 表示 否定 意义 的 感叹 号 〈!)， 用 法 如 下 。 


[meelinuxbox -]$ sed -n '/SUSE/ip' distros.txt 


Fedora 
Ubuntu 
Fedora 
Ubuntu 
Fedora 
Ubuntu 
Ubuntu 
Fedora 
Fedora 
Ubuntu 
Ubuntu 
Fedora 


10 11/25/2008 
8.04 04/24/2008 
11/08/2007 
10 10/26/2006 
05/31/2007 
10 10/18/2007 
04 04/19/2007 
10/24/2006 
05/13/2008 
6.06 06/01/2006 
8.10 10/30/2008 
5 03/20/2006 


这 样 我 们 得 到 了 理想 输出 结果 ， 即 除了 那些 与 正则 表达 式 匹 配 的 行 ， 其 他 
所 有 行 都 显示 出 来 了 。 


到 目前 为 止 ， 我 们 已 经 介绍 了 sed 的 两 个 编辑 命令 一 一 s 和 p， 表 20-8 是 一 
张 更 完整 的 基本 编辑 指令 表 。 


表 20-8 sed 基本 编辑 指令 


命令 


功能 描述 


输出 当前 行 号 
在 当前 行 后 附加 文本 
删除 当前 行 
在 当前 行 前 输入 文本 
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续 表 
命令 功能 描述 
打印 当前 行 。 默 认 情 况 下 ，sed 会 输出 每 一 行 并 且 只 编辑 文件 内 那些 匹配 指定 
地 址 的 行 。 当 指定 -n 选项 时 ， 默 认 操 作 会 被 覆盖 
q 退出 sed 不 再 处 理 其 他 行 。 如 果 没有 指定 -mn 选项， 就 会 输出 当前 行 
Q 直接 退出 sed 不 再 处 理 行 


将 regexp 的 内 容 替 换 为 replacement 代表 的 内 容 。replacement 可 能 会 包含 特殊 
字符 &， 它 代表 的 其 实 就 是 regexp 所 表示 内 容 。 除 此 之 外 ，replacement 也 可 

s/regexp/replacement/ ”能 包含 \1 到 \9 的 序列 ， 它 们 代表 的 是 regexp 中 相应 位 置 的 描述 内 容 。 学 习 接 
下 来 关于 回 参 考 的 讨论 可 以 了 解 更 多 这 方面 的 知识 。 跟 在 replacement 后 面 的 
反 斜 杜 ， 可 以 指定 一 个 可 选择 的 标志 以 修改 s 命令 的 行为 


将 字符 集 setl 转换 为 字符 集 set2。 请 注意 ， 与 tr 不 同 ，sed 要 求 这 两 个 字符 集 


y/setl/set2 等 长 


s 命令 是 目前 为 止 使 用 最 普遍 的 编辑 命令 。 接 下 来 , 我 们 通过 编辑 distros.txt 
文件 来 演示 其 强大 功能 的 一 小 部 分 。 之 前 已 经 讨论 过 distros.txt 文件 中 的 时 间 字 
段 并 不 是 以 “计算 机 友好 ”的 形式 存储 ， 因 为 此 时 间 形 式 是 MM/DD/YYYY， 
YYYY-MM-DD 这 样 的 形式 会 方便 很 多 《更 容易 排序 )。 但 如 果 手 动 更 改 文件 ， 
不 仅 浪 费时 间 而 且 容易 出 错 ， 而 sed 可 以 一 步 完 成 这 样 的 操作 。 


[me@linuxbox ~]$ sed 's/ 八 ([0-9]\{2\}\)\A\([0-9]\{2\}\)AI0-9]\{4\)\)SA\3-\1 
-\2/' distros.txt 


SUSE 10.2 2006-12-07 
Fedora 10 2008-11-25 
SUSE 11.0 2008-06-19 
Ubuntu 8.04 2008-04-24 
Fedora 8 2007-11-08 
SUSE 10.3 2007-10-04 
Ubuntu 6.10 2006-10-26 
-Fedora 7 2007-05-31 
Ubuntu 7.10 2007-10-18 
Ubuntu 7.04 2007-04-19 
SUSE 10.1 2006-05-11 
Fedora 6 2006-10-24 
Fedora 9 2008-05-13 
Ubuntu 6.06 2006-06-01 
Ubuntu 8.10 2008-10-30 
Fedora 5 2006-03-20 


哇塞 ! 这 个 命令 行 看 起 来 还 真 复 杂 ， 但 它 确实 有 效 。 只 需 一 步 ， 就 改变 了 
文件 中 的 日 期 形式 。 此 例 充 分 解释 了 为 什么 正则 表达 式 有 时 被 开玩笑 的 称 为 
“只 写 ” 人 介质。 因为 我 们 可 以 编写 正则 表达 式 ， 但 有 时 却 读 不 懂 它 们 。 在 被 该 
命令 行 吓 跑 之 前 ， 这 我 们 还 是 先 来 分 析 它 的 各 组 成 部 分 的 含义 。 首 先 ，sed 命 
令 有 其 基本 结构 ， 如 下 所 示 。 


sed 's/regexp/replacement/' distros.txt 
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接 下 来 我 们 需要 理解 将 日 期 分 隔 开 来 的 正则 表达 式 。 由 于 它 是 以 MM/DD/ 
YYYY 的 形式 存在 ， 并 且 出 现在 行 末尾 ， 所 以 使 用 如 下 的 表达 式 。 
[o-9]{2}1[0-91{2}1[0-9]{4]$ 

该 表达 式 的 匹配 格式 :两 位 数字 、 斜 枉 、 两 位 数字 、 斜 枉 、4 位 数字 以 及 行 
尾 标 志 。 所 以 这 代表 了 regexp 表达 式 的 形式 , 但 是 怎么 处 理 replacement 的 表达 
式 ? 解决 这 一 问题 ， 我 们 必须 引进 正则 表达 式 的 一 个 新 特性 ， 该 特性 一 般 存 在 
于 那些 使 用 BRE 的 应 用 中 。 此 特性 称 为 回 参 考 ， 并 且 工 作 方式 类 似 于 此 ， 即 如 
果 replacement 中 出 现 了 va 转 义 字符 ， 并 且 这 里 的 是 1-9 之 间 的 任意 数字 ， 那 
么 此 转 义 字符 就 是 指 前 面 正 则 表达 式 中 与 之 相对 应 的 子 表 达 式 。 如 何 创 建 该 表 
达 式 ， 可 以 简单 地 将 其 括 于 括号 中 ， 如 下 所 示 。 

([0-9]{2})/([0-9] {2})/([0-9]{4})$ 

现在 ， 我 们 便 有 了 三 个 子 表达 式 。 第 一 个 的 内 容 是 月 份 ， 第 二 个 内 容 是 具 
体 的 日 ， 第 三 个 内 容 则 是 指 年 份 。 于 是 便 可 用 如 下 命令 行 构建 替换 字符 。 
\3-\1-\2 

该 表达 式 表示 的 顺序 如 下 : 年 份 、 斜 枉 、 月 份 、 斜 枉 和 具体 的 日 。 

于 是 ， 整 个 命令 行 如 下 。 


sed ,s/([0-91{2})1([0-91{2})1([0-9]{4})$/\3-\1-\21，distros .txt 

但 是 仍 有 两 个 遗留 问题 : 第 一 ， 当 sed 试图 编译 s 命令 时 ， 正 则 表达 式 中 多 
余 的 斜 杠 会 令 sed 混淆 ;第 二 ，sed 默认 情况 下 只 接受 基本 正则 表达 式 ， 所 以 正 
则 表达 式 中 的 部 分 元 字符 会 被 当成 文字 字符 。 我 们 可 以 利用 反 斜 杠 来 避免 这 些 
冒犯 字符 ， 从 而 一 次 性 解决 这 两 个 问题 。 


sed 's/\([0-9] \{2\}\)\/\([O0-9]\{2\}\)\/\([O-9]\{4\}\)$/\3-\1-\2/' dis 
tros.txt 


这 样 便 大 功 告 成 了 ! 

s 命令 的 另外 一 个 特点 ， 就 是 替换 字符 串 后 面 可 以 紧 跟 可 选择 标志 符 。 其 中 
最 重要 的 标志 符 就 是 g， 该 标志 告诉 sed 对 每 行 的 所 有 匹配 项 进行 替换 操作 ， 而 
不 是 默认 的 只 替换 第 一 个 匹配 项 。 

示例 如 下 。 


[meelinuxbox ~]$ echo "aaabbbcecc" | sed 's/b/B/' 
aaaBbbccc 


我 们 可 以 看 到 执行 了 替换 操作 ， 但 只 是 对 第 一 个 字母 b 有 效 ， 剩 下 的 字母 
并 没有 改变 。 通 过 增加 g 标志 符 ， 便 可 以 对 所 有 的 b 进行 替换 操作 。 


256 ”Linux 命令 行 大 全 


[meelinuxbox ~]$ echo "aaabbbccc*” | sed '5/b/8/9g， 
aaaBBBccc 


到 目前 为 止 ， 我 们 只 使 用 了 命令 行 方式 向 sed 传送 操作 命令 ， 其 实 也 可 以 
用 -f 选 项 建立 更 复杂 的 命令 脚本 文件 。 作 为 演示 实例 ， 我 们 运用 distros.txt 文件 
结合 sed 创建 一 个 报告 。 该 报告 的 构成 有 顶端 标 题 、 修 改 时 间 和 大 写字 和 母 组 成 
的 所 有 发 行 版 本 名 。 进 行 这 些 操 作 之 前 ， 我 们 需要 编写 一 个 脚本 文件 ， 所 以 启 
动 文本 编辑 器 并 输入 如 下 内 容 。 
# Sed Script to produce Linux distributions report 
1 i\ 
Linux Distributions Report\ 


Ss/\([0-9] \{2\}\)\/\ (IO-91\{2\}\)\/\([O-9]\{4\}\)$/\3-\1-\2/ 
y/abcdefghijklmnopqrstuvwxyz /ABCDEFGHIJKLMNOPQRSTUVWXYZ/ 


将 此 sed 脚本 保存 为 distros.sed， 并 且 照 如 下 方式 运行 。 
[me@linuxbox ~]$ sed -f distros.sed distros.txt 


Linux Distributions Report 


SUSE 10.2 2006-12-07 
FEDORA 10 2008-11-25 
SUSE 11.0 2008-06-19 
UBUNTU 8.04 2008-04-24 
FEDORA 8 2007-11-08 
SUSE 10.3 2007-10-04 
UBUNTU 6.10 2006-10-26 
FEDORA 7 2007-05-31 
UBUNTU 7.10 2007-10-18 
UBUNTU 7.04 2007-04-19 
SUSE 10.1 2006-05-11 
FEDORA 6 2006-10-24 
FEDORA 9 2008-05-13 
UBUNTU 6.06 2006-06-01 
UBUNTU 8.10 2008-10-30 
FEDORA 5 2006-03-20 


正如 读者 所 看 到 的 ， 输 出 显示 了 理想 结果 ， 但 是 它 到 底 是 如 何 工作 的 呢 ? 
让 我 们 再 次 查看 脚本 文件 ， 并 使 用 cat 将 行 号 都 标注 出 来 。 


fmeelinuxbox ~]$ cat -n distros.sed 
# sed script to produce Linux distributions report 


1 i\ 
\ 
Linux Distributions Report\ 


Ss/\([O-9]\{2\7\)\/\ (LO-9] \{2\}\)\/\([O0-9]\{4\}7\)$/\3-\1-\2/ 
y/abcdefghijklmnopqrstuvwxyz /ABCDEFGHIJKLMNOPQRSTUVWXYZ/ 


[ee 
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第 一 行 只 是 一 个 声明 。 与 Linux 系统 中 的 许多 配置 文件 和 编程 语言 一 样 ， 
声明 一 般 都 是 以 “#” 符 号 开头 。 剩 下 的 则 是 一 些 人 类 可 理解 的 文本 。 声 明 可 以 
放 于 脚本 文件 的 任何 位 置 ( 只 要 不 在 命令 行 中 )， 并 且 对 于 任何 一 个 需要 验证 或 
是 维护 该 脚本 的 人 都 很 有 用 。 

第 二 行 是 空白 行 。 与 声明 一 样 ， 空 白 行 也 是 为 了 增加 可 读 性 。 

多 数 sed 命令 都 支持 行 地 址 ， 这 些 行 地 址 用 于 指定 哪些 输入 行 执行 指定 操 
作 。 行 地 址 可 以 用 简单 的 行 号 来 描述 ， 也 可 以 用 行 号 范围 以 及 “$” 表 示 , “$” 
是 一 个 表示 文本 最 后 一 行 的 特殊 符号 。 


第 3~6 行 包含 的 则 是 要 插入 文本 中 第 一 行 的 内 容 。i 命令 后 面 紧 跟 转 义 回 
车 符 ， 转 义 回 车 符 由 反 斜 杜 和 回 车 符 组 成 ， 亦 称 为 行 继 续 符 。 此 种 先 反 斜 杠 
后 回 车 符 的 顺序 ， 可 以 用 于 包括 shell 脚本 在 内 的 许多 场合 ,可 确保 文本 流 中 
风 入 回 车 符 但 不 会 告诉 编译 器 (在 sed 这 个 例子 中 ) 已 经 到 了 行 末 尾 。i 命令 、 
a 命令 (追加 文本 ) 以 及 c 命令 (替换 文本 ) 能 作用 于 多 个 文本 行 ， 只 要 除 
了 最 后 一 行 的 每 行 都 以 行 继续 符 结尾 。 该 脚本 文件 的 第 6 行 确实 是 所 输入 文 
本 的 末尾 行 ， 并 且 标 志 i 命令 结尾 的 符号 是 一 个 简单 的 回 车 符 而 不 再 是 行 继 
续 符 。 


行 继续 符 是 由 反 儿 杠 后 紧 跟 回 车 符 组 成 ， 两 者 之 间 不 容许 有 任何 空格 。 


第 7 行 是 查找 和 替换 命令 。 由 于 该 命令 前 并 末 指 定 地 址 ， 所 以 该 命令 将 对 
输入 流 的 每 一 行进 行 操作 。 

第 8 行 则 实现 了 小 写字 和 母 向 大 写字 母 的 转变 。 注 意 ,与 tt 不 同 ，sed 中 的 y 
命令 并 不 支持 字符 范围 (例如 [a-z])， 也 不 支持 POSIX 字符 类 。 同 样 ， 由 于 y 
命令 前 并 没有 指定 地 址 ， 所 以 将 对 输入 流 的 每 一 行 执行 操作 。 


偏爱 sed 的 人 同样 会 喜欢 ……… 
sed 是 一 个 功能 非常 强大 的 程序 , 它 可 以 对 文本 流 执行 非常 复杂 的 编辑 任 
务 。 它 通常 用 于 简单 的 单 命令 行 任 务 而 不 是 长 脚本 。 对 于 更 大 些 的 任务 ， 许 
多 用 户 则 偏向 于 其 他 工具 。 其 中 最 受 欢 迎 的 有 awk 和 perl1。 这 两 个 命令 已 经 
超出 了 本 书 所 谈论 的 命令 范畴 ， 并 且 延 伸 到 了 完整 的 编程 语言 领域 。 尤 其 是 
perl1， 通 常 取代 shell 脚本 用 于 执行 系统 管理 和 管理 员 任务 ， 同 时 也 是 一 个 非 
常 受 欢迎 的 web 开发 介质 。 而 awk 则 更 专业 化 ,数据 处 理 是 其 强项 . 它 与 sed 
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的 相似 之 处 就 是 awk 命令 通常 也 是 逐 行 处 理 文本 文件 ， 并 且 使 用 方法 也 继承 
了 sed 的 地 址 后 面 加 上 执行 操作 这 一 个 概念 。 虽然 awk 和 perl 都 不 在 本 书 的 
讨论 范围 中 ， 但 对 于 Linux 命令 行 用 户 来 说 它们 仍然 是 非常 有 用 的 工具 。 


20.5.3 ”aspell 一 一 交互 式 拼 写 检 查 工 具 


最 后 一 个 所 要 讨论 的 文本 工具 就 是 aspell， 它 是 交互 式 的 拼写 检查 工具 。 
aspell 命令 继承 的 是 早期 的 ispell 命令 ， 并 且 多 数 情况 下 ， 可 以 直接 取代 ispell。 
虽然 aspell 命令 通常 为 那些 需要 进行 拼写 检查 的 程序 所 用 ， 但 它 同样 可 以 作为 
一 个 独立 于 命令 行 的 工具 发 挥 其 效用 。 它 可 以 智能 地 检查 不 同类 型 文本 文件 的 
错误 ， 包 括 HTML 文件 、C/C++ 程 序 、email 消息 以 及 其 他 专业 的 文本 文件 。 

检查 一 篇 简单 散文 的 拼写 错误 ， 可 以 用 如 下 方式 使 用 aspell。 
aspell check textfile 

此 处 的 testfile 是 要 进行 检查 的 文件 名 。 作 为 实例 进行 讲解 ， 下 面 创建 了 一 
个 简单 的 foo.txt 文本 文件 ， 它 包含 一 些 故意 的 拼写 错误 。 


[me@linuxbox ~]$ cat > foo.txt 
The quick brown fox jimped over the laxy dog. 


接 下 来 使 用 aspell 检查 文件 中 的 拼写 错误 。 
[me@linuxbox ~]$ aspelil check foo.txt 
由 于 aspell 在 检验 模式 下 是 与 用 户 交互 的 ， 所 以 我 们 会 看 到 如 下 的 显示 界面 。 


The quick brown fox over the laxy dog. 


1) jumped 6) wimped 

2) gimped 7) camped 

3) comped 8) humped 

4) limped 9) impede 

5) pimped 0) umped 

i) Ignore 1) Ignore al1 
r) Replace R) Replace all 
a) Add 1) Add Lower 


? 


显示 内 容 的 顶部 ， 被 怀疑 错误 的 字符 是 以 高 亮 的 形式 显示 的 。 中 间 部 分 ， 
有 10 个 标号 从 0 一 9 的 替换 拼写 建议 以 及 其 他 可 能 的 动作 选项 。 最 后 ， 末 端 有 
一 个 提示 框 供用 户 进行 操作 选择 。 
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假定 我 们 输入 1， 则 aspell 会 将 错误 的 单词 用 jumped 取代 并 且 继 续 处 理 下 
一 个 错误 单词 lagy。 如 果 选 择 替 代 单 词 lazy，aspell 便 执行 此 替换 操作 然后 终止 
程序 。aspell 命令 检查 结束 后 ， 可 以 再 次 查看 文件 ， 会 发 现 那些 拼写 错误 的 单词 
已 经 改正 过 来 ， 如 下 所 示 。 


[meelinuxbox ~]$ cat foo.txt 
The quick brown fox jumped over the lazy dog. 


除非 额外 指定 了 命令 行 选项 --dont-backup, 不 然 aspell 将 会 创建 一 个 包含 原 
文本 内 容 的 备份 文件 ， 此 备份 文件 文件 名 则 由 原文 件 名 加 上 后 缀 .bak 组 成 。 


sed 其 实 有 更 强大 的 编辑 功能 ， 恢 复 foo.trt 文件 中 原 有 的 拼写 错误 以 便 再 次 
利用 : 
[me@linuxbox ~]$ sed -i 's/lazy/laxy/; s/jumped/jimped/' foo.txt 


sed 选项 -i 告诉 sed“ 原 地 ”编辑 文件 ， 这 表示 sed 不 会 将 编辑 结果 送 至 标 
准 输出 ， 而 是 将 改变 后 的 文本 重新 写 入 文件 中 。 同 样 可 以 看 出 ， 一 个 命令 行 中 
可 以 输入 多 个 编辑 命令 ， 只 要 用 分 号 将 它们 隔 开 即 可 。 


接 下 来 就 来 讨论 一 下 aspell 如 何 处 理 不 同类 型 的 文件 。 使 用 诸如 vim 的 文本 
编辑 器 “可 以 挑战 性 地 尝试 使 用 sed)， 给 文件 增加 一 些 HTML 语言 ， 如 下 所 示 。 


<html> 
<head> 
<title>Mispelled HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</html> 


现在 ， 如 果 试 图 检查 修改 后 该 文件 的 拼写 错误 ， 便 会 遇 到 一 个 问题 。 照 如 
下 方式 输入 命令 行 。 


[me@linuxbox ~]$ aspell check foo.txt 
便 会 得 到 如 下 输出 结果 。 
< 


<head> 
<title>Mispelled HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</html> 


1) HTML 4) Hamel 


260 ”Linux 命令 行 大 全 


2) ht ml 5) Hamil 

3) ht-ml 6) hotel 

i) Ignore 1) Ignore all 

r) Replace R) Replace all 

a) Add 1) Add Lower 

Abort . Exit 
7 


aspell 会 认为 HTML 标签 的 所 有 内 容 是 拼写 错误 。 该 问题 可 以 通过 增加 -H 
CHTML) 模式 选项 克服 ， 示 例如 下 。 


[me@linuxbox ~]$ aspell -H check foo.txt 


可 以 得 到 如 下 结果 ; 
<html> 
<head> 
<title>BEEE HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</jhtml> 
1) Mi spelled 6) Misapplied 
2) Mi-spelled 7) Niscalled 
3) Misspelled 8) Respelled 
4) Dispelled 9) Misspell 
5) Spelled 0) Misled 
i) Ignore 1) Ignore all 
r) Replace R) Replace all 
a) Add 1) Add Lower 
扣 Abort -| Exit 
? 


使 用 -H 选项 后 ，HTML 语言 部 分 就 被 忽略 了 ， 只 有 那些 非 HTML 标签 部 分 
才 会 被 检查 。 这 种 模式 下 ，HTML 标签 内 容 被 忽略 了 并 且 不 会 进行 拼写 检查 。 
然而 ，ALt 标签 的 内 容 ， 在 这 种 模式 下 则 是 要 检查 的 。 


默认 情况 下 ，aspell 会 忽略 文本 中 的 URL 和 email 地 址 ， 该 行为 可 以 通过 
设置 命令 行 选项 履 盖 。 同 样 也 可 以 指定 哪些 标签 内 容 需 要 被 检查 ， 而 哪些 可 跳 
过 检查 。 具 体内 容 ， 可 以 查看 aspell 的 man 手册 页 。 


20.6 本章 结 尾 语 


本 章 主要 介绍 了 一 些 用 于 文本 编辑 的 命令 行 工 具 ， 下 一 章 会 介绍 更 多 的 这 
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类 工具 。 不 得 不 承认 ， 虽 然 文中 已经 列举 了 其 中 部 分 命令 的 应 用 实例 ， 但 你 仍 
然 可 能 会 对 如 何 使 用 以 及 为 什么 使 用 这 些 工具 存在 疑问 ， 而 且 答 案 似 乎 并 不 是 
那么 显而易见 。 在 后 面 的 章节 中 ， 相 信 大 家 会 逐渐 发 现 这 些 工具 其 实 是 解决 一 
组 实际 问题 的 基本 工具 ， 在 后 面 接触 到 shell 脚本 的 知识 时 ， 这 些 工 具 才 会 真正 
体现 其 价值 。 


20.7 ”附加 项 


还 有 许多 更 有 趣 的 文本 操作 命令 值得 探索 。 这 些 命令 包括 split (将 文件 分 
成 多 个 部 分 )、csplit (基于 上 下 文 将 文件 分 块 ) 以 及 sdiff (左右 并 排 显 示 文 件 差 
异 并 作 比 较 )。 


*21s 


格式 化 输出 


本 章 继 续 讨论 与 文本 相关 的 工具 ， 重 点 讲 一 些 用 于 格式 化 文本 输出 而 非 改 


变 文本 自身 内 容 的 命令 。 这 些 命令 通常 用 于 文本 的 打印 ， 而 “打印 ”这 一 主题 
将 在 下 一 章 介绍 。 本 章 将 要 讨论 的 命令 如 下 所 示 。 


nl: 对 行进 行 标号 。 

fold: 设 定 文本 行 长 度 。 

fmt: 简单 的 文本 格式 化 工具 。 
pr: 格式 化 打印 文本 。 
printf: 格式 化 并 打印 数据 。 
grof: 文档 格式 化 系统 。 


264 Linux 命令 行 大 全 


21.1 简单 的 格式 化 工具 
首先 让 我 们 看 一 些 简单 的 格式 化 工具 ， 它 们 多 数 都 是 “ 单 目的 ”程序 ， 而 
且 一 般 执行 一 些 不 复杂 的 操作 ， 它 们 一 般 用 于 一 些小 的 任务 ， 并 作为 管道 传输 
和 脚本 的 一 部 分 。 


21.1.1 “nl 一 一 对 行进 行 标号 


nl 命令 是 一 个 非常 神秘 的 工具 ， 用 于 完成 一 个 非常 简单 的 任务 : 对 行进 行 
编号 。 就 其 最 简单 用 法 ， 与 cat -n 很 相似 。 


[meelinuxbox -~]$ nl distros.txt | head 


1 SUSE 10.2 12/07/2006 
2 Fedora 10 11/25/2008 
3 SUSE 11.0 06/19/2008 
4 Ubuntu 8.04 04/24/2008 
5 Fedora 8 11/08/2007 
6 SUSE 10.3 10/04/2007 
7 Ubuntu 6.10 10/26/2006 
8 Fedora 7 05/31/2007 
9 Ubuntu 7.10 10/18/2007 
10 Ubuntu 7.04 04/19/2007 


和 cat 命令 一 样 , nl 既 支 持 多 个 文件 名 作为 命令 行 参数 , 也 支持 标准 输入 。 然而 ， 
nl 可 以 进行 多 种 复杂 的 编号 ， 因 为 它 有 许多 参数 选项 ， 且 支持 原始 形式 的 标记 。 


nl 进行 标号 时 支持 一 个 叫做 逻辑 页 的 概念 ， 所 以 它 可 以 重 置 〈 重 新 开始 ) 
数值 序列 。 通 过 合理 运用 参数 选项 ，nl 可 以 设置 起 始 编号 为 特定 的 值 ， 并 在 有 
限 的 范围 内 设置 其 格式 。 风 辑 页 可 以 进一步 分 解 为 逻辑 页 标题 、 正 文 和 页 脚 。 
在 每 一 个 部 分 中 , 行 号 都 可 以 重 置 并 /或 分 配 不 同 的 风格 。 如 果 nl 的 输入 参数 是 
多 个 文件 ， 那 么 nl 会 把 它们 当 作 一 个 文本 流 整体 。 文 本 流 中 的 每 一 个 部 分 都 由 
一 些 看 起 来 非常 奇怪 的 标记 来 区 别 ， 表 21-1 列 出 了 部 分 标记 。 


表 21-1 nl 标记 


标记 含义 
Wt 逻辑 页 页 眉 开头 
Ww: 逻辑 页 正文 开头 
v 逻辑 页 页 脚 开头 


表 21-1 中 的 每 一 个 标记 元 素 在 一 行 中 只 允许 出 现 一 次 。 每 次 处 理 完 一 个 标 
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记 元 素 后 ，nl 便 将 其 从 文本 流 中 删除 。 
表 21-2 列 出 了 nl 的 常用 选项 。 
表 21-2 常用 的 nl 选项 


选项 会 义 
-b style 按照 style 格式 对 正文 进行 编号 ， 这 里 的 style 是 下 面 类 型 中 的 一 个 
。 a 对 每 行 编号 


。 t 仅仅 对 非 空 白 行 编 号 ， 此 选项 是 默认 的 
。 n 不 对 任何 行进 行 编号 
。 pregexp ”只 对 与 基本 正则 表达 式 匹 配 的 行进 行 编号 


-fstyle 以 style 的 格式 对 页 脚 进行 编号 。 默 认 选 项 是 n (无 ) 
-hstyle ， 以 style 的 格式 对 标题 进行 编号 。 默认 选项 是 n (无 ) 


-i number 设置 页 编号 的 步 进 值 为 number。 默 认 值 为 1 

-nformat 设置 编号 格式 为 format， 此 处 的 format 可 以 是 如 下 表示 中 的 一 种 
e ln 左 对 齐 ， 无 缩 进 
。 rn 右 对 齐 ， 无 缩 进 。 这 是 默认 选项 
。 rz 右 对 齐 ， 有 缩 进 


-Pp 在 每 个 逻辑 页 的 开始 不 再 进行 页 编码 重 置 

-S string 在 每 行 行 号 后 面 增加 string 作为 分 隔 符 。 默 认 的 情况 下 是 一 个 简单 的 tab 制 表 符 
-Vv number 将 每 个 逻辑 页 的 第 一 个 行 号 设 为 number。 默 认 是 1 

-Ww width 设置 行 号 字段 的 宽度 为 width。 默 认 值 是 6 


不 得 不 承认 ， 用 户 可 能 并 不 会 那么 频繁 地 进行 行 编号 ， 但 是 ， 用 户 可 以 利 
用 nl 结合 其 他 工具 进行 更 复杂 的 任务 。 基于 上 一 章 的 基础 , 我 们 生成 一 个 Linux 
发 行 版 本 的 报告 。 由 于 我 们 会 使 用 mi， 报告 中 最 好 包含 标题 /正文 /页 脚 等 标记 。 
我 们 可 以 用 上 章 提 到 的 sed 脚本 添加 这 些 标记 , 用 文本 编辑 器 对 sed 脚本 文件 做 
如 下 改动 ， 并 将 其 存 于 distros-nl.sed 文件 中 。 


# sed Script to produce Linux distributions report 


1 1i\ 
WWM: 
\ 


Linux Distributions Report\ 

a Ver. Released\ 
Ws 站 
Ss/\([O-9] \{2\}\)\/\ (IO-9] \{2\} AIO-9l\ft4\T\)$A\3- 1-\2/ 
NA 


\ 
End Of Report 
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该 脚本 文件 完成 了 向 原 报告 中 插入 nl 逻辑 页 标记 以 及 在 报告 末尾 添加 页 脚 内 容 
的 任务 。 请 注意 , 输入 标记 时 必须 使 用 双 反 和 斜 杠 ， 否则 sed 会 将 它们 解释 为 转 义 字符 。 


接 下 来 ， 我 们 便 可 以 结合 sort、sed 和 ml 创建 一 个 增强 版 的 报告 。 


[me@linuxbox ~]$ sort -k 1,1 -k 2n distros.txt | sed -f distros-nl.sed | nl 


Linux Distributions Report 


Name Ver. Released 
1 Fedora 5 2006-03-20 
2 Fedora 6 2006-10-24 
3 Fedora 7 2007-05-31 
4 Fedora 8 2007-11-08 
5 Fedora 9 2008-05-13 
6 Fedora 10 2008-11-25 
7 SUSE 10.1 2006-05-11 
8 SUSE 10.2 2006-12-07 
9 SUSE 10.3 2007-10-04 
10 SUSE 11.0 2008-06-19 
11 Ubuntu 6.06 2006-06-01 
12 Ubuntu 6.10 2006-10-26 
13 Ubuntu 7.04 2007-04-19 
14 Ubuntu 7.10 2007-10-18 
15 Ubuntu 8.04 2008-04-24 
16 Ubuntu 8.10 2008-10-30 


End Of Report 


多 个 命令 进行 管道 传输 得 到 了 需求 结果 。 首 先 ， 我 们 根据 发 行 版 名 称 和 发 
行 时 间 《〈 字 段 1 和 字段 2) 进行 排序 ， 然 后 用 sed 处 理 排序 结果 ， 添 加 了 报告 的 
页 眉 〈 包 括 nl 的 有 还 辑 页 标记 ) 和 页 脚 ， 最 后 ， 我 们 执行 了 ml 命令 。nl 在 默认 情 
况 下 ， 只 会 对 属于 逻辑 页 正文 部 分 的 文本 流 进行 行 编号 。 


我 们 可 以 重复 执行 nl， 并 尝试 不 同 的 参数 选项 。 如 下 所 示 列 举 了 一 些 有 趣 
的 参数 。 


nl -n rz 
以 及 
nl -WwW3-Ss 
21.1.2 fold 一 一 将 文本 中 的 行 长 度 设 定 为 指定 长 度 
fold 是 一 个 将 文本 行 以 指定 长 度 分 解 的 操作 。 与 其 他 命令 类 似 , fold 支持 一 
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个 或 多 个 文本 文件 或 是 标准 输入 作为 输入 参数 。 向 fold 输入 一 个 简单 的 文本 流 ， 


便 可 了 解 其 工作 方式 。 
[me@linuxbox ~]$ echo “The quick brown fox jumped Over the lazy dog.” | fold 
-W 12 


The quick br 
own fox jump 
ed over the 
lazy dog . 


这 样 ， 我 们 便 能 明白 fold 到 底 完成 了 什么 操作 。echo 命令 输出 的 文本 被 指定 
了 -w 选项 的 fold 分 解 成 了 片段 。 本 例 中 ， 指 定 了 行 的 宽度 为 12 个 字符 。 如 果 没 
有 指定 行 宽 ， 则 默认 是 80 个 字符 宽 。 请 注意 ，fold 在 断 行 时 并 不 会 考虑 单词 边界 。 
而 增加 -s 选项 ， 可 使 fold 在 到 达 width 字符 数 前 的 最 后 一 个 有 效 空格 处 将 原文 本 
行 断 开 ， 示 例如 下 。 


[me@linuxbox ~]$ echo “The quick brown fox jumped over the lazy dog.” | fold 
-W 12 -S 
The quick 
brown fox 
jumped over 
the lazy 
dog . 


21.1.3 ”fmt 一 一 简单 的 文本 格式 化 工具 


fmt 命令 同样 会 折合 文本 ， 另 外 还 包括 更 多 其 他 功能 。 它 既 可 以 处 理 文件 也 
可 以 处 理 标准 输入 ， 并 对 文本 流 进行 段落 格式 化 。 就 其 基本 功能 而 言 ， 它 可 以 
在 保留 空白 行 和 缩 进 的 同时 对 文本 行进 行 填充 和 连接 。 


作为 演示 的 文本 内 容 ， 不 如 从 fimt 的 帮助 手册 页 中 复制 一 些 内 容 吧 。 


‘fmt' reads from the specified FILE arguments (or standard input if none 
are given), and writes to standard output. 


By default, blank lines, spaces between words, and indentation are 
preserved in the output; successive input lines with different 
indentation are not joined; tabs are expanded on input and introduced on 
output . 


‘fmt' prefers breaking lines at the end of a Sentence，and tries to avoid 
line breaks after the first word of a sentence or before the last word of a 
sentence. A “sentence break” is defined as either the end of a paragraph or a 
word ending in any of ‘.?!', followed by two spaces or end of line, ignoring 
any intervening parentheses or quotes. Like TeX, ‘fmt' reads entire 
“paragraphs” before choosing line breaks; the algorithm is a variant of that 
given by Donald E. Knuth and Michael F. Plass in “Breaking Paragraphs Into 
Lines”, ‘Software--Practice & Experience' 11, 11 (November 1981), 1119-1184. 


将 这 段 文字 复制 到 文本 编辑 器 中 ， 并 将 其 存 为 fint-info.txt 文本 文件 。 现 在 ， 
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假定 我 们 需要 重新 格式 化 该 文本 ， 以 满足 每 行 50 个 字符 宽 的 规则 。 那 么 我 们 可 
以 输入 fmt 结合 -w 选项 完成 这 样 的 格式 化 。 


[me@linuxbox ~]$ fat -w 50 fmt-info.txt | head 
‘fmt’' reads from the specified FILE arguments 
(or standard input if 

none are given), and writes to standard output. 


By default, blank lines, spaces between words, 
and indentation are 
preserved in the output; successive input lines 
with different indentation are not joined; tabs 
are expanded on input and introduced on output. 


这 个 输出 结果 还 真是 奇怪 。 也 许 ， 实 际 上 我 们 应 该 认真 地 阅读 一 遍 下 面 的 
文字 ， 因 为 它 解释 了 事情 发 生 的 原委 。 


默认 情况 下 ， 空 白 行 、 单 词 之 间 的 空格 和 缩 进 都 保留 在 输出 结果 
中 ; 不 同 缩 进 量 的 连续 输入 行 并 不 进行 拼接 ， 制 表 符 会 在 输入 中 扩展 
并 直接 输出 。 


所 以 ，fimt 保留 了 第 一 行 的 缩 进 。 幸 运 的 是 ，fmt 提供 了 一 个 参数 选项 以 修 
正 这 一 问题 。 


[meelinuxbox ~]$ fmt -ew 50 fmt-info.txt 

‘fmt' reads from the specified FILE arguments 
(or standard input if none are given), and writes 
to standard output. 


By default, blank lines, spaces between words, 
and indentation are preserved in the output; 
successive input lines with different indentation 
are not joined; tabs are expanded on input and 
introduced on output. 


‘fmt' prefers breaking lines at the end of a 
sentence, and tries to avoid line breaks after 
the first word of a sentence or before the 
last word of a sentence. A “sentence break” 
is defined as either the end of a paragraph 
or a word ending in any of ‘.?!', followed 


by two spaces or end of line, ignoring any 
intervening parentheses or quotes. Like TeX， 
‘fmt' reads entire “paragraphs” before choosing 
line breaks; the algorithm is a variant of 

that given by Donald E. Knuth and Michael F. 
Plass in “Breaking Paragraphs Into Lines”,. 
‘Software--Practice & Experience' 11, 11 
(November 1981), 1119-1184. 


这 样 一 来 ， 输 出 结果 看 起 来 顺眼 了 很 多 。 由 此 可 见 ， 通 过 增加 -e 选项 ， 我 
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们 便 得 到 了 理想 输出 结果 。 
fmt 有 一 些 有 趣 的 选项 ， 见 表 21-3 。 


表 21-3 fimt 选项 
选项 功能 描述 


在 “ 冠 边缘 ”模式 下 运行 。 此 模式 保留 段落 前 两 行 的 缩 进 ， 随 后 的 行 都 与 第 二 行 的 缩 
进 对 齐 

只 格式 化 以 前 缀 字符 串 string 开头 的 行 。 格 式 化 后 ，string 的 内 容 仍然 会 作为 每 一 个 
格式 化 行 的 前 级 。 该 选项 可 以 用 于 格式 化 内 容 是 源 代码 的 文本 ， 例 如 ， 任 何以 “#” 
号 作为 声明 开头 的 编程 语言 或 是 配置 文件 都 可 以 通过 指定 -p '# 选 项 进行 格式 化 ， 指 
定 该 选项 后 可 保证 只 格式 化 声明 中 的 内 容 。 具 体 的 可 见 后 续 例 子 

“ 仅 截断 行 ”模式 。 在 此 模式 下 ， 将 会 只 根据 指定 的 列 宽 截断 行 。 而 短 行 并 不 会 与 其 
他 行 结合 。 此 模式 适用 于 格式 化 文本 但 不 需要 行 拼接 的 场合 ， 比 如 代码 等 


字符 间隔 统一 。 采 取 传 统 的 “打字 机 风格 ”模式 格式 化 文本 ， 这 意味 着 字符 之 间 间 隔 
-u 一 个 空格 字符 ， 句 子 之 间 间 隔 两 个 空格 字符 。 该 模式 对 于 删除 齐 行 非常 有 用 ， 所 谓 齐 
行 就 是 指 文本 行 被 强迫 与 左右 边缘 对 齐 


格式 化 文本 使 每 行文 本 不 超过 width 个 字符 ， 默 认 值 是 75。 请 注意 ，fimt 格式 化 文本 
时 往往 由 于 要 保持 行 平衡 而 使 得 行 实际 宽度 比 指定 宽度 略 小 


= 


-w width 


-p 选项 尤为 有 趣 ， 通 过 它 ， 我 们 可 以 选择 性 地 格式 化 文件 内 容 ， 前 提 是 要 
格式 化 的 文本 行 都 以 相同 的 字符 序列 开头 。 许 多 编程 语言 都 使 用 hash 符号 〈#) 
作为 注释 的 开始 ， 因 此 可 以 用 此 选项 只 格式 化 注释 文本 。 下 面 创建 一 个 有 注释 
的 类 似 于 程序 的 文本 文件 。 


[me@linuxbox ~]$ cat > fmt-code.txt 
# This file contains code with comments. 


# This line is a comment. 
# Followed by another comment line. 
# And another. 


This, on the other hand, is a line of code. 
And another line of code. 
And another. 


我 们 的 示例 文本 包含 了 以 “#”(“#” 号 后 紧 跟 一 个 空格 》 字 符 串 开头 的 注 
释 以 及 “代码 ” 行 ( 虽 然 并 不 是 真正 意义 上 的 代码 )。 现 在 ， 我们 使 用 fmt 格式 
化 该 注释 内 容 而 不 改动 代码 。 


[me@linuxbox ~]$ fmt -w 50 -p '# ' fmt-code.txt 
# This file contains code with comments. 


# This line is a comment. Followed by another 
# comment line. And another. 


This, on the other hand, is a line of code. 
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And another line of code. 
And another. 


请 注意 ， 紫 邻 的 注释 行 已 经 拼接 起 来 ， 但 是 保留 了 空白 行 以 及 不 是 以 指定 
前 组 开头 的 文本 行 。 


21.1.4 “pr 一 一 格式 化 打印 文本 


Pr 命令 用 于 给 文本 标 页 码 。 打 印 文本 时 ， 通 常 希望 将 输出 内 容 分 成 几 页 ， 并 
且 每 页 的 顶部 和 底部 都 留 出 几 行 空白 行 ， 这 些 空 自行 可 以 用 于 播 入 页 层 和 页 脚 。 


示例 如 下 ， 该 命令 行将 distros.txt 文件 格式 化 为 一 系列 非常 短 的 页 〈 只 显示 
了 前 两 页 )。 


[me@linuxbox ~]$ pr -1 15 -w 65 distros.txt 


2012-12-11 18:27 distros.txt Page 1 
SUSE 10.2 12/07/2006 
Fedora 10 11/25/2008 
SUSE 11.0 06/19/2008 
Ubuntu 8.04 04/24/2008 
Fedora 8 11/08/2007 
2012-12-11 18:27 distros.txt Page 2 
SUSE 10.3 10/04/2007 
Ubuntu 6.10 10/26/2006 
Fedora 7 05/31/2007 
Ubuntu 7.10 10/18/2007 
Ubuntu 7.04 04/19/2007 


上 例 中 ， 结 合 了 -1 选项 〈 页 长 ) 以 及 -w 选项 (页 宽 ) 定义 了 一 “页 ”内 容 
包含 15 行 ， 每 行 包含 65 个 字符 。pr 对 distros.txt 文件 的 内 容 进行 分 页 ， 页 与 页 
之 间 则 用 几 行 空白 行 隔 开 ， 并 且 创 建 了 一 个 包含 文件 修改 时 间 、 文 件 名 以 及 页 
码 的 默认 页 局 。pr 命令 有 很 多 选项 用 于 控制 页 面 布 局 ， 详 见 第 22 章 。 


21.1.5 ”printf 一 一 格式 化 并 打印 数据 


与 本 章 中 涉及 的 其 他 命令 不 一 样 ，printf 命令 并 不 适用 于 管道 传输 (也 就 是 
说 它 不 支持 标准 输入 )， 而 且 在 命令 行 应 用 中 它 也 不 常见 〈 多 应 用 于 脚本 文件 )。 
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那么 它 到 底 为 什么 会 这 么 重要 ? 因为 它 有 如 此 广泛 的 应 用 范围 。 

printf (短语 print formatted 的 缩写 ) 起 初 是 为 C 语言 开发 的 ， 后 来 许多 编 
程 语言 也 都 实现 了 这 一 功能 ， 也 包括 shell 环境 。 事实 上 ， 在 bash 中 ，printf 是 
内 置 的 。 

printf 的 用 法 如 下 。 
printf “format” arguments 

该 命令 行 给 出 了 一 个 包含 格式 说 明 的 字符 串 ， 然 后 将 该 格式 应 用 于 
arguments 所 代表 的 输入 内 容 ， 最 后 格式 化 结果 送 至 标准 输出 。 如 下 就 是 一 个 简 
单 例子 。 


[me@linuxbox ~]$ printf “I formatted the string: %s\n’” foo 
I formatted the string: foo 


该 格式 化 字符 串 可 以 包含 文字 文本 〈 如 “I formatted the string”)、 转 义 字 符 
(如 m， 即 换行 符 ) 以 及 以 % 开 头 的 表示 转换 规格 的 字符 序列 。 上 例 中 ， 转 换 规 
格 %s 用 于 格式 化 字符 串 foo 并 将 其 结果 输出 。 再 看 下 面 一 个 例子 。 


{me@linuxbox ~]$ printf “I formatted '%s' as a string.\n” foo 
I formatted 'foo' as a string. 


以 上 可 以 看 出 ，%s 所 代表 的 转换 规格 被 字符 串 foo 取代 。s 表示 格式 化 字 
符 串 数据 ， 其 他 类 型 的 数据 则 用 其 他 指定 字符 表示 。 表 21-4 列 出 了 常用 的 数据 
类 型 。 
表 21-4 常用 printf 数据 类 型 指定 符 


指定 符 说 明 

D 将 一 个 数字 格式 化 为 有 符号 的 十 进 制 表示 形式 

F 格式 化 数字 并 以 浮 点 数 的 格式 输出 

0 将 一 个 整数 格式 化 为 八进制 格式 的 整数 

S 格式 化 字符 串 

x 将 一 个 整数 格式 化 为 十 六 进 制 的 数 ， 并 且 在 使 用 字母 时 ， 用 小 写字 母 af 表示 
X 与 x 类似 ， 只 是 字母 用 大 写字 母 表示 


% 打印 文字 符号 “%”( 例 如 ， 指 定 “%%”) 


下 例 中 ， 利 用 字符 串 “380” 演 示 了 每 个 转换 说 明 符 的 使 用 效果 : 


[me@linuxbox ~]$ printf “%d, %f, %0o, %s, %xX, %X\n” 380 380 380 380 380 380 
380，380.000000，574，380，17c，17C 
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本 例 指定 了 6 个 转换 说 明 符 ， 并 向 printf 提供 了 6 个 输入 参数 。 得 到 了 6 
种 转换 说 明 符 的 输出 效果 。 

转换 说 明 符 也 可 以 通过 增加 一 些 可 选 组 件 以 对 输出 效果 进行 调整 。 一 个 完 
整 的 转换 规格 可 能 会 包含 如 下 内 容 。 
%{flags] {width]i.precisionlconversion_specification 

当 使 用 多 个 可 选 组 件 时 ， 这 些 组 件 必须 按照 上 面 的 顺序 才能 被 正确 编译 。 
表 21-5 给 出 了 每 个 组 件 的 说 明 。 


表 21-5 printf 转换 规范 的 组 成 部 分 


组 件 


flags 


width 


.precision 


功能 描述 


总 共有 5 个 不 同 的 fag 

。 # 使 用 替代 格式 输出 。 这 取决 于 数据 类 型 。 对 于 o〈 八 进 制 数 ) 类 转换 ， 输 出 结果 以 
0 开头 。 对 于 x 和 XX 类 转换 ， 输 出 则 分 别 以 0x 和 0X 开头 

。 0 ( 零 ) 用 0 填充 输出 。 这 代表 着 字段 前 会 填充 0， 如 000380 

。 -〔 破 折 号 ) 输出 左 对 齐 。 默 认 情况 下 ，printf 是 右 对 齐 输出 的 

。 ”空格 ) 为 正 数 产生 一 个 前 导 空 格 

。 十 《加 号 ) 正 数 符号 。 默 认 情 况 下 ，printf 只 会 输出 负数 的 符号 


一 个 数字 ， 该 数字 指定 了 最 小 字段 宽度 


对 于 浮 点 数 ， 便 是 指定 小 数 点 后 的 小 数 精确 度 。 对 于 字符 串 转换 ，precision 则 指定 了 输 
出 字符 的 个 数 


表 21-6 列 出 了 一 些 不 同 格式 化 实例 。 
表 21-6 print 转换 规范 实例 


参数 格式 转换 结果 说 明 

380 “%d” 380 对 整数 进行 简单 的 格式 化 

380 “ofx” Oxl7c 使 用 替代 格式 标记 将 整数 格式 化 为 一 个 十 六 进 制 数 

G8 «“%05d” ， 00380 ee 5 个 字符 宽度 的 字段 ， 不 足 位 数 可 在 
将 数字 格式 化 为 精确 到 小 数 点 后 5 位 的 浮上 点数， 不 足 位 数 

380 “9%05.5f” 380.00000 “用 0 填充 。 由 于 指定 的 最 小 字段 宽度 (5) 要 比 格式 化 后 
实际 的 数值 位 数 小 ， 所 以 此 处 并 没有 进行 填充 

380 “%010.5f” ”0380.00000 ”把 最 小 字段 宽度 增加 为 0， 并 且 0 填充 可 见 

380 “9%6+d?” +380 + 标记 符 表 示 此 数 是 正 数 

380 “%-d” 380 -标记 表示 左 对 齐 

abcedfghijk “%5s” abcedfghijk ”用 最 小 的 字段 宽度 来 最 小 化 字符 串 

abcedfghijk “%.5s” abcde 根据 字符 串 的 精确 位 数 截断 字符 串 


21.2 
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同样 ，printf 通常 用 于 脚本 文件 的 表格 数据 格式 化 操作 ， 而 并 不 会 直接 应 用 
于 命令 行 。 不 过 ， 我 们 仍然 可 以 用 其 解决 各 种 各 样 的 格式 化 问题 。 首 先 ， 我 们 
可 以 利用 printf 输出 一 些 由 制 表 符 隔 开 的 字段 。 


[me@linuxbox ~]$ printf “ss\t%s\t%s\n” Str1 str2 str3 
str1 str2 str3 


插入 Yt〈Tab 的 转 义 符 )， 便 获得 了 理想 结果 。 接 下 来 ， 利 用 其 输出 一 些 格式 
整齐 的 数字 。 


[meelinuxbox ~]$ printf “Line: %05d %15.3f Result: %+i5d\n” 1071 3.14156295 
32589 
Line: 01071 3.142 Result: +32589 


此 例 充分 显示 了 最 小 字段 宽度 对 字段 间距 的 影响 。 那 么 如 何 格 式 化 一 个 小 
网 页 呢 ? 


[me@linuxbox ~]$ printf “<html>\n\t<head>\n\t\t<title>%s</title>\n\t</head> 
\n\t<body>\n\t\t<p>%s</p>\n\t</body>\n</htel>\n” “Page Title” “Page Content” 
<html> 
<head> 
<title>Page Title</title> 
</head> 
<body> 
<p>Page Content</p> 
</body> 
</html> 


文档 格式 化 系统 


到 目前 为 止 ， 本章 只 介绍 了 一 些 简单 的 文本 格式 化 工具 。 这 些 工具 对 于 一 
些小 的 、 简 单 的 任务 非常 有 用 ， 那 对 于 一 些 比较 大 的 任务 呢 ? 系统 为 用 户 提供 
了 多 种 编辑 多 类 型 文件 的 工具 , 特别 是 科学 类 和 学 术 类 的 出 版 物 , 这 也 是 UNIX 
成 为 一 个 在 科学 和 技术 领域 比较 受 欢迎 的 操作 系统 的 原因 之 一 (还 有 一 个 原因 
就 是 UNIX 提供 了 强大 的 多 任务 、 多 用 户 的 软件 开发 环境 )。 事 实 上 ， 正 如 下 面 
的 GNU 文档 所 描述 的 ， 文 档 编辑 对 UNIX 的 开发 很 重要 。 


第 一 个 版 本 的 UNIX 系统 是 在 贝尔 实验 室 的 PDP-7 上 开发 的 .1971 
年 ,， 开发 者 们 想 要 一 台 PDP-11 以 对 操作 系统 进行 进一步 的 研究 。 为 了 
充分 证 明 这 一 系统 值得 花费 这 么 多 资金 ， 开 发 者 们 指出 会 为 AT&T 专 
利 部 门 完成 一 种 文件 格式 化 系统 。J.F. Ossanna 是 该 格式 化 程序 首 任 作 
者 ， 另 外 ， 此 程序 其 实 是 Mclllroy 编写 的 rof 程 序 的 重新 实现 。 
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21.2.1 


roff 和 TeX 家 族 


当今 主宰 文档 格式 化 领域 的 主要 有 两 大 家 族 ， 它 们 是 从 原始 roff 程序 延伸 
而 来 的 nroff 和 troff 和 基于 Donald Knuth 的 TEX (发 音 为 “tek' ) 排版 系统 。 自 
然 ，TEX 中 间 偏 低 的 字母 “E” 不 可 忽略 。 


ro 六 这 个 名 字 来 源 于 “T1l run offa copy for you.” 中 的 短语 “yun of ”。nroff 
程序 格式 化 后 的 文档 一 般 输 出 至 使 用 等 宽 字 体 的 设备 ， 诸 如 字符 终端 、 类 打字 
机 风格 的 打印 机 等 。 在 该 程序 风靡 期 间 ， 它 几乎 覆盖 了 所 有 与 计算 机 相连 的 打 
印 设备 。 后 来 的 troff 程序 则 用 于 格式 化 排 字 机 等 设备 输出 的 文档 ， 这 些 设备 通 
常 输出 “camera-ready” 格 式 的 文本 用 于 商业 印刷 。 如 今 ， 多 数 电 脑 打 印 机 都 能 
模拟 排 字 机 的 输出 。roff 系列 还 包含 了 一 些 用 于 处 理 其 他 文件 类 型 的 程序 , 这 些 
程序 包括 eqn 〈 针 对 数学 等 式 ) 以 及 tbl〈 针 对 表格 ) 等 。 

TeX 系统 〈 其 稳定 版 本 ) 在 1989 年 首次 成 形 ， 并 且 一 定 程 度 上， 取代 了 troff 
而 成 为 排 字 机 输出 文档 的 格式 化 工具 。 本 书 不 讨论 TEX， 不 仅 是 因为 其 比较 复杂 
《有 好 几 本 单独 讲述 TeX 的 书籍 )， 还 因为 多 数 现代 Linux 系统 并 不 会 默认 安装 它 。 


对 于 那些 对 安装 TEX 有 兴趣 的 读者 ， 可 以 学 习 texlive 软件 包 以 及 LyX 图 
形 编辑 器 的 相关 知识 ，texlive 软件 包 在 绝 大 多 数 发 行 版 本 库 中 都 能 找到 。 


21.2.2 ”groff- 一 一 文档 格式 化 系统 


groff 其 实 是 GNU 实现 方式 的 troff 系列 程序 集 ， 它 还 包含 一 个 用 于 模拟 nroff 
及 其 他 roff 家 族 系列 的 程序 功能 的 脚本 。 


虽然 ro 企及 其 衍生 体 都 是 用 来 创建 格式 化 文件 的 ， 但 是 它们 格式 化 的 方式 对 
于 现代 用 户 来 说 却 非常 陌生 。 如 今 多数 文 档 都 是 用 文字 处 理 器 编辑 的 ， 并 且 这 些 
文字 处 理 器 可 以 一 步 完 成 文档 的 内 容 编辑 和 布局 格式 安排 。 图 形 化 文字 处 理 器 出 
现 之 前 ， 文 档 编辑 通常 包括 两 个 步骤 一 一 使 用 文本 编辑 器 编辑 内 容 和 使 用 诸如 
tro 他 这样 的 程序 进行 格式 化 ， 格 式 化 程序 的 指令 都 已 经 通过 标记 语言 嵌入 到 文本 
中 。 现 代 的 网 页 制作 过 程 与 此 过 程 相 似 ， 因 为 网 页 也 是 先 通过 某 种 文本 编辑 器 编 
辑 ， 然 后 使 用 由 网 络 浏览 器 提供 的 HTML 标记 语言 来 描述 最 后 的 网 页 布局 的 。 


当然 ， 本 章 并 不 打算 全 面 讨论 groff， 因 为 它 的 许多 标记 语言 元 素 都 与 一 些 
非常 诡秘 的 排版 细节 相关 。 相 反 ， 大 家 还 是 应 该 把 精力 集中 到 仍然 广泛 应 用 的 
“ 宏 包 ”上 。 这 些 “ 宏 包 ” 将 许多 低级 命令 压缩 成 一 个 很 小 的 高 级 命令 集 ， 从 而 
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使 得 gro 企 使 用 起 来 容易 得 多 。 


耽误 一 点 时 间 ， 大 家 先 来 看 一 看 下 面 这 个 不 起 眼 的 手册 页 ， 它 是 /psrsjpare/ 
man 目录 下 的 一 个 gzip 压缩 的 文本 文件 。 查 看 其 解压 缩 后 内 容 ， 可 以 用 下 面 的 
命令 行 〈ls 的 man 手册 页 在 第 一 部 分 有 说 明 )。 


[me@linuxbox ~]$ zcat /usr/share/man/man1/ls.1.9z | head 

.\” DO NOT MODIFY THIS FILE! It was generated by help2man 1.35. 
.TH LS “1” “April 2008” “GNU coreutils 6.10” “User Commands” 
.SH NAME 

ls \- list directory contents 

.SH SYNOPSIS 

.日 1S 

[\fIOPTION\fR]... [\fIFILE\fR]... 

.SH DESCRIPTION 

.\” Add any additional description here 

.PP 


与 其 正常 的 man 手册 页 进行 比较 分 析 ， 就 可 以 发 现 标记 语言 及 其 输出 结果 
之 间 的 相关 性 。 


[meelinuxbox -]$ man ls | head 
LS(1) User Commands LS(1) 


NAME 
ls - list directory contents 


SYNOPSIS 
1s [OPTION]... {FILE]... 


这 真 的 很 有 趣 ， 因 为 此 man 手册 页 是 由 groff 使 用 mandoc 的 “ 宏 包 ”进行 
浏览 的 。 事 实 上 ， 我 们 还 可 以 用 如 下 管道 传输 模拟 man 命令 。 
[me@linuxbox ~]$ zcat /usr/share/man/mani/ls.1.gz | groff -mandoc -T ascii | 


head 
LS(1) User Commands LS(1) 


NAME 
ls - list directory contents 


SYNOPSIS 
ls [OPTION]... [FILE]... 


此 处 , 我 们 利用 了 gro 任 程序 ， 并 设置 参数 指定 为 mandoc“ 宏 包 ” 以 及 ASCII 
的 输出 格式 。groff 可 以 输出 多 种 不 同 格式 的 结果 ， 如 果 未 指定 输出 格式 ， 那 么 
PostScript 便 是 其 默认 输出 格式 。 


Ime@linuxbox -]$ zcat /usr/share/man/mnani/ls.1.9z | groff -mandoc | head 
%IPS-Adobe-3.0 
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%%Creator: groff version 1.18.1 
%x%CreationDate: Thu Feb 2 13:44:37 2012 
%%DocumentNeededResources: font Times-Roman 


%%+ font Times-Bold 
%%+ font Times-Italic 
%%DocumentSuppliedResources: procset grops 1.18 1 


%%Pages: 4 


%%pPage0rder: Ascend » 
%%0rientation: Portrait 


PostScript 是 一 种 页 面 描 述 语言 ， 一 般 用 于 描述 送 至 类 排 字 机 设备 打印 的 页 
面 内 容 。 我 们 可 以 提取 gro 人 ff 命令 的 输出 结果 并 将 其 存 于 文件 中 〈 假 设 使 用 的 是 


备 有 Desktop 目录 的 图 形 化 桌面 系统 )。 


[meelinuxbox ~]$ zcat /usr/share/man/man1/1s.1.9Z | groff -mandoc > ~/Desktop 


/foo.ps 


桌面 上 应 该 会 出 现 一 个 表示 输出 文件 的 图 标 , 双击 该 图 标 启 动 页 面 浏 览 器 ， 
见 图 21-1) 显示 该 文件 内 容 。 


Ele Edt Yiew Go Help 


ot [page Wichi | 
Next 二 


浏览 器 便 以 其 所 默认 的 形式 〈 


Thurnbnails ~ 乒 


LS(1) 


NAME 


dno 


User Commands LS(1) 


1s — list directory contents 


SYNOPSIS 


ls [OPTION]... [FILE] 


DESCRIPTION 


List information about the FILEs (the current directory by default). Sort entries alphabetically if none of 
-cftavySUX nor —sort. 


Mandatory arguments to long options are mandatory for short oplions too. 
一 3. 一 ai 
do not ignore entries starting with 
—A, —almost—all 
do not list implied . and .. 
——author 
with —1, print the author of each file 
-b. 一 escape 
print octal escapes for nongraphic characters 
——block—size=SIZE 
use SIZE-byte blocks 
-B. 一 ignore-backups 
do not list implied entries ending with 


一 with 一 tt: sort by, and show, ctime (time of last modification of file status information) with 一 
show ctime and sort by name otherwise: sort by ctime 


-C listentriesby columns 
—color[=WHEN] 
control whether color is used to distinguish file types. WHEN may be ‘never', ‘always’, or ‘auto’ 


图 21-1 用 GNOME 中 的 页 面 浏览 器 查看 PostScript 格式 的 输出 内 容 
我 们 得 到 的 是 一 个 排版 整齐 的 ls 的 man 手册 页 ! 事实 上 ， 我 们 可 以 用 下 面 
的 ps2pdf 命令 将 PostScript 格式 的 文件 转化 为 PDF (Portable Document Format， 


可 移植 文档 格式 ) 文件 ， 示 例如 下 。 


EE 
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[meelinuxbox ~]$ ps2pdf -/Desktop/foo.ps ~/Desktop/1s.pdf 


ps2pdf 程序 是 ghostscript 软件 包 的 一 个 小 成 员 ， 该 程序 在 多 数 支持 打印 的 
Linux 系统 上 都 有 安装 。 


Linux 系统 通常 包含 许多 进行 文件 格式 转换 的 命令 行程 序 , 它们 的 命名 方式 


通常 为 format2format。 尝 试 使 用 命令 行 1s /usr/bin/*[[:alpha:]]2[[:alpha:]]* 输 出 程 
序 名 列表 ， 另 外 作为 比较 ， 可 以 尝试 搜索 名 为 formattoformat 的 程序 。 


作为 groff 的 最 后 一 个 演示 实例 ， 重 新 启用 “ 老 朋友 ”distros.txt 文件 。 此 次 ,使 
用 表格 格式 化 工具 tbl 对 distros.txt 文件 中 的 Linux 发 行 版 本 列表 进行 排版 。 要 完成 
这 样 的 操作 ， 需 要 使 用 较 早 的 sed 脚本 向 gro 企 将 要 处 理 的 文本 流 中 增加 标记 语言 。 


首先 ， 需 要 对 sed 脚本 做 一 些 修改 ， 比 如 增加 tbl 命令 需要 的 一 些 必 要 项 。 
使 用 文本 编辑 器 ， 将 distros.sed 脚本 改 为 如 下 内 容 。 


# sed script to produce Linux distributions report 


.TS\ 

center box;\ 

cb 3 S\ 

cb cb cb\ 

lnec.\ 

Linux Distributions Report\ 


Name Version Released\ 
s/\([0-9] \{2\\) WA (LO-9] \{2\}W) WA (LO-9] \{A\}N) S/N3-\1-\2)/ 
$a\ 


"TE 


请 注意 ， 该 脚本 文件 车 要 正常 工作 ， 必 须 确保 其 中 的 “Name Version Released” 
词组 之 间 是 以 tab 制 表 符 而 不 是 空格 分 开 。 此 外 ， 将 输出 结果 另存 为 distros-tbl.sed 
文件 。tbl 使 用 .TS 和 .TE 请 求 作 为 表格 的 开头 和 末尾 ， 跟 在 .TS 请 求 后 面 的 行 定 
义 了 表格 的 全 局 属性 。 就 本 例 而 言 ， 其 定义 了 页 面 内 容 水 平 居中 并 用 文本 框 包 
围 这 样 的 属性 。 定 义 文 本 的 其 余 内 容 则 描述 了 每 个 表格 中 行 的 布局 。 现 在 ， 我 
们 使 用 新 的 sed 脚本 处 理 groff 的 格式 化 结果 ， 便 会 得 到 下 面 的 内 容 。 


[me@linuxbox ~]$ sort -k 1,1 -k 2n distros.txt | sed -f distros-tbl.sed | groff 


+ 
lFedora 5 2006-03-20 | 
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|Fedora 6 
|Fedora 7 
|Fedora 8 
[Fedora 9 
|Fedora 10 

|SUSE 10. 
|SUSE 10. 
|SUSE 10. 
|SUSE 11 

|Ubuntu 6， 
[Ubuntu 6 
|Ubuntu 7 
1Ubuntu 2 
IUbuntu 8 
|Ubuntu 8 


gro 任 增加 -t 选项 表示 先 用 tpl 预 处 理 文本 流 。 同 样 ， 增 加 -T 选项 则 输出 ASCII 


2006-10-24 
2007-05-31 
2007-11-08 
2008-05-13 
2008-11-25 
1 2006-05-11 
2 2006-12-07 
3 2007-10-04 


.0 2008-06-19 


06 2006-06-01 


.10 2006-10-26 
.04 2007-04-19 


10 2007-10-18 


:04 2008-04-24 
.10 2008-10-30 


格式 的 数据 ， 否 则 会 输出 默认 的 PostScript 格式 。 


如 果 显 示 终端 或 是 打字 机 类 型 的 打印 机 能 力 有 限 ， 那 么 ASCII 码 的 输出 格 


式 其 实 是 所 能 期 望 的 最 好 的 显示 格式 了 。 但 是 ， 如 果 指 定 了 PostScript 格式 的 输 
出 ， 并 用 图 形 化 方式 查看 ， 便 会 得 到 令 人 更 满意 的 输出 效果 《〈 见 图 21-2)。 


{me@linuxbox ~]$ sort -k 1,1 -k 2n distros.txt | sed -f distros-tbl.sed | groff 
-+t > ~/Desktop/foo.ps 


ile Edit View Go Help 


Oe Oe 


Linux Distributions Report 

Name Version Released 
Fedora 3 2006-03-20 
Fedora 和 2006-10-24 
Fedora 2007-05-31 
Fedora 8 2007-11-08 
Fedora 9 2008-05-13 
Fedora 10 2008-11-25 
SUSE 10.1 2006-05-11 
SUSE 10.2 2006-12-07 
SUSE 10.3 2007-10-04 
SUSE 11.0 2008-06-19 
Ubuntu 6.06 2006-06-01 
Ubuntu 6.10 2006-10-26 
Ubuntu 7.04 2007-04-19 
Ubuntu 7.10 2007-10-18 
Ubuntu 8.04 2008-04-24 
Ubuntu 8.10 2008-10-30 | 


21-2 完成 格式 转换 后 的 输出 表格 
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21.3 本章 结尾 语 


既然 文本 对 于 类 UNIX 操作 系统 中 的 字符 是 如 此 重要 ， 那 么 有 许多 用 于 操 
控 和 格式 化 文本 的 工具 就 显得 很 有 必要 。 我 们 已 经 知道 ， 确 实 有 很 多 这 样 的 文 
本 工具 ! 简单 的 格式 化 工具 , 如 fimt 和 pr 在 一 些 生成 短文 档 的 脚本 中 用 途 很 大 ， 
而 像 groff 这 类 复杂 工具 则 可 以 用 来 排版 书籍 。 当 然 ， 我 们 可 能 永远 也 不 会 用 命 
令 行 工 具 来 编辑 技术 文档 (尽管 也 有 许多 人 这 么 做 !)， 但 是 知道 可 以 用 命令 行 
完成 也 不 失 为 一 件 好 事 。 


HA 


打 印 


前 面 几 章 讲 述 了 文本 的 操纵 , 现在 是 时 候 讨论 如 何 将 文本 输出 到 纸张 上 了 ， 
本 章 将 会 介绍 一 些 用 于 打印 文件 以 及 控制 打印 机 操作 的 命令 行 工 具 。 诚 然 ， 本 
书 并 不 会 讨论 如 何 配置 打印 参数 ， 因 为 这 取决 于 不 同 的 发 行 版 本 ， 而 且 通 常 操 
作 系 统 安 装 时 就 已 自动 设置 完成 。 请 留意 ， 本 章 的 实例 练习 中 会 需要 一 个 有 效 
的 打印 机 配置 文件 。 


本 章 会 讨论 如 下 命令 。 
。 pr: 转换 文本 文件 ， 从 而 进行 打印 操作 。 
。 lpr: 打印 文件 。 
。 Ip: 打印 文件 (System V)。 
。 a2ps: 格式 化 文件 ， 以 在 PostScript 打印 机 上 打印 。 
。 lpstat: 显示 打印 状态 信息 。 
。 lpq: 显示 打印 机 队列 状态 。 
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22.1 


。 lprm: 取消 打印 任务 。 
。 cancel: 取消 打印 任务 (System V)。 


打印 操作 简 史 


在 充分 理解 类 UNIX 操作 系统 的 打印 特性 之 前 ， 我 们 必须 首先 了 解 一 些 打 
印 操作 的 发 展 史 。 类 UNIX 系统 的 打印 操作 可 以 追溯 到 操作 系统 的 起 源 。 那 个 
时 期 ， 打 印 机 及 其 使 用 方法 都 与 现在 有 很 大 区 别 。 


22.1.1 ”灰暗 时 期 的 打印 


与 计算 机 类 似 ， 打 印 机 在 前 PC 时 代 也 具有 庞大 、 昂贵 和 集中 化 的 特点 。 20 
世纪 80 年 代 ， 计 算 机 用 户 都 在 离 计 算 机 一 定 距离 的 终端 上 进行 操作 ， 打 印 机 也 
是 置 于 计算 机 附近 而 处 于 计算 机 操作 员 的 监控 下 工作 。 


UNIX 早期 ， 打 印 机 贵 而 集中 化 ， 多 个 用 户 共用 一 台 打 印 机 是 司空 见 惯 的 
事 。 为 了 区 分 某 个 任务 属于 哪 一 个 具体 用 户 , 一 张 显示 用 户 名 的 标题 页 (banner 
page) 通常 会 在 每 个 打印 任务 的 开头 打印 出 来 ， 然 后 计算 机 辅助 人 员 会 把 当天 
的 打印 任务 装 到 一 个 手推车 中 ， 然 后 将 它们 配送 给 各 个 用 户 。 


22.1.2 ”基于 字符 的 打印 机 


与 今天 的 打印 机 技术 相 比 ，20 世纪 80 年 代 的 打印 机 技术 在 两 个 方面 有 很 大 
的 不 同 。 第 一 ，20 世纪 80 年 代 的 打印 机 基本 上 都 是 击 打 式 打印 机 。 击 打 式 打印 
机 采取 机 械 机 制 通过 色 带 撞击 页 面 ， 从 而 在 页 面 上 形成 字符 印迹 。 菊 花 轮 打印 
和 点 阵 打印 是 当时 非常 受 欢迎 的 两 种 技术 。 


第 二 ,也 是 更 重要 的 一 点 , 早期 打印 机 使 用 的 是 设备 本 身 所 固有 的 字符 集 。 例 
如 ,菊花 轮 打 印 机 只 能 打印 那些 已 经 塑造 成 菊花 轮 花瓣 形状 的 字符 ,这 使 得 打印 机 
就 像 高 速 打字 机 一 样 。 而 多 数 打字 机 打字 的 时 候 使 用 的 是 等 宽 〈 固 定 宽度 ) 字体 ， 
这 意味 着 每 个 字符 都 有 相同 的 宽度 。 并 且 打 印 机 在 纸张 的 固定 位 置 进行 打印 ， 打 印 
区 域 包含 固定 数量 的 字符 。 多 数 打印 机 水 平方 向 上 每 英寸 打印 10 个 字符 (10CPT)， 
垂直 方向 上 每 英寸 打印 6 行 (6LPI) 内 容 。 在 这 样 的 机 制 下 ， 一 张 美式 信纸 可 容纳 
85 字符 宽 、66 行 高 的 内 容 。 考 虑 到 每 个 边界 将 留 有 少许 页 边 距 ， 于 是 每 行 最 多 可 
打印 80 个 字符 , 这 就 解释 了 为 什么 终端 显示 (以 及 终端 仿真 器 ) 只 有 80 个 字符 宽 。 
它 提供 了 一 种 以 等 宽 字体 表现 的 WYSIWYG 所 见 即 所 得 〉 的 输出 视觉 效果 。 
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需要 打印 的 字符 数据 以 简单 的 字 节 流 的 形式 发 送 给 上 述 类 打字 机 打印 设 
备 。 例 如 , 在 打印 字母 a 时， ASCII 码 97 便 被 发 送出 去 。 另外, 低 编 号 的 ASCII 
控制 码 则 用 于 移动 打印 机 的 送 纸箱 和 纸张 ， 以 及 取代 回 车 、 换 行 、 换 页 符 等 。 
控制 代码 的 使 用 ， 可 以 获得 一 定 的 字体 效果 。 比 如 粗 体 可 以 通过 先 打 印 一 个 字 
符 ， 然 后 退 格 再 打印 一 次 的 方法 来 实现 。 如 下 例 ， 我 们 使 用 nro 企 浏览 man 手册 
页 ， 并 且 使 用 cat -A 选项 查看 粗 体 效果 。 
[me@linuxbox -]$ zcat /usr/share/nan/mani/1ls.1.9z | nroff -man | cat -A | head 
LS(1) User Commands LS(1) 


$ 
$ 


$ 
N“^HNA~*HAM^HME^HES$ 
ls - list directory contents$ 


S~HSY<HYNHNO~HOP HPS"HSIAHIS "HSS 
1*Hls*Hs[_^HO_“^HP_^HT_^HI_^HO_“HN] ...[_^HF_^HI_“HL_^HE]...$ 
其 中 ^ (表示 Ctrl-H 快捷 键 ) 字符 是 用 来 创建 粗 体 效果 的 后 退 格 。 类 似 地 ， 
我 们 还 可 以 用 退 格 /下 划 线 以 产生 下 划 线 效果 。 


22.1.3 ”图 形 化 打印 机 


GUI 的 发 展 促进 了 打印 机 技术 的 重大 变革 。 由 于 计算 机 日 渐 趋 向 于 图 形 化 
显示 ， 打 印 技术 也 从 基于 字符 走向 图 形 化 。 低 成 本 的 激光 打印 机 的 出 现 为 这 一 
转变 提供 了 可 能 。 激 光 打 印 机 可 以 在 页 面 的 任何 可 打印 区 域 打印 一 个 个 小 点 ， 
而 不 是 打印 单个 固定 字符 ， 如 此 便 可 以 按 比例 打印 文字 (类 似 于 排版 机 )， 甚 至 
是 照片 以 及 高 质量 的 图 表 。 


然而 ， 基 于 字符 的 打印 机 制 向 图 形 化 机 制 的 转变 仍 存在 一 个 艰巨 的 技术 性 挑 
战 。 原 因 是 ， 使 用 基于 字符 的 打印 机 时 ， 填 充 一 页 纸 所 需要 字 节 数 可 以 用 如 下 方 
法 计算 (假定 一 页 有 60 行 ， 每 一 行 包 合 80 个 字符 )，60 x 80 = 4,800 字 节 。 

相 比 较 而 言 , 一 个 每 英寸 300 个 点 (300 DPI) 的 激光 打印 机 (假设 每 页 包含 8 x 
10 英寸 打印 区 域 ) 则 需要 (8 x 300) x (10 x 300) = 8 = 900,000 个 字 节 来 填充 一 页 纸 。 

多 数 慢 速 PC 网 络 根 本 无 法 处 理 激 光 打 印 机 打印 一 整 页 纸 所 需要 的 这 近 
1MB 的 数据 ， 所 以 很 明显 ， 我 们 需要 一 个 更 高 端的 发 明 。 

页 面 描述 语言 (PDL) 解决 了 这 一 问题 ， 页 面 描述 语言 是 一 种 描述 页 面 内 
容 的 编程 语言 。 它 的 描述 方式 可 以 简单 表达 为 “在 这 个 地 方 ， 使 用 10 个 点 的 无 
衬 线 字体 (Helvetica,)， 打 印 a 字符 ;在 这 个 地 方 ……- ” 直到 该 页 所 有 内 容 被 
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述 结 束 。 第 一 个 主流 页 面 描述 语言 是 Adobe 系统 的 PostScript， 如 今 仍 被 广泛 
使 用 。PostScript 几乎 是 为 排版 或 是 其 他 的 图 表 图 像 印 刷 而 量 身 定做 的 一 套 完整 
的 编程 语言 。 它 除了 自 带 的 35 种 标准 的 高 质量 字体 外 ， 还 允许 用 户 在 运行 时 定 
义 额外 字体 。 对 PostScript 的 支持 已 内 风 在 打印 机 中 , 这 解决 了 数据 传送 的 问题 。 
虽然 PostScript 语言 相 比 于 基于 字符 的 打印 机 使 用 的 简单 比特 流 显 得 元 长 ， 但 却 
比 打 印 整 页 所 需要 的 字符 容量 要 小 很 多 。 

PostScript 打印 机 以 PostScript 程序 作为 输入 。 该 打印 机 自 带 处 理 器 和 存储 
器 (这 些 使 得 打印 机 成 为 比 其 连接 的 计算 机 功能 更 强 的 计算 机 )， 它 可 以 运行 
PostScript 解释 器 ， 该 解释 器 读 入 PostScript 程序 并 将 其 解释 结果 送 至 打印 机 内 
部 的 存储 器 ， 如 此 便 形成 了 向 纸张 传送 的 位 (点 模式。 这 个 将 程序 转变 为 大 
型 位 模式 〈 称 为 点 阵 图 ) 的 过 程 统 称 为 光栅 图 形 处 理 器 ， 或 RIP。 


随 着 时 间 的 推移 ， 计 算 机 和 网 络 的 速度 也 越 来 越 快 ， 这 使 得 可 以 让 计算 机 
来 执行 RIP 过 程 而 非 让 打印 机 执行 ， 这 使 得 高 质量 打印 机 的 价格 下 降 了 很 多 。 


如 今 的 许多 打印 机 仍然 支持 字符 流 输入 ， 但 是 那些 价钱 比较 低 的 打印 机 仍 
然 不 可 以 。 它 们 主要 依赖 于 主 计算 机 的 RIP 提供 比特 流 以 进行 点 打印 。 当 然 ， 
现今 也 还 是 有 一 些 PostSeript 打印 机 的 。 


22.2 ”Linux 方式 的 打印 


现代 Linux 系统 采取 两 组 软件 来 执行 和 管理 打印 操作 : 第 一 种 是 CUPS ( 通 
用 UNIX 打印 系统 )， 提 供 打 印 驱 动 程序 以 及 打印 任务 管理 程序 ， 另 一 种 是 
Ghostscript， 这 是 一 个 Postscript 编译 器 ， 充 当 RIP 的 作用 。 


CUPS 通过 创建 、 维 护 打 印 队列 进行 打印 机 管理 。 正 如 前 面 在 介绍 打印 机 历 
史 时 介绍 的 UNIX 打印 的 设计 初衷 是 管理 多 用 户 共享 的 集中 化 打印 机 。 由 于 打 
印 机 的 处 理 速 度 比 驱 动 它们 的 计算 机 慢 ， 所 以 打印 系统 需要 一 种 协调 多 个 打印 
任务 的 机 制 ,从 而 使 所 有 事情 能 井然 有 序 地 进行 。 CUPS 能 够 识别 不 同类 型 的 数 
据 《〈 在 合理 范围 内 )， 且 能 将 文件 转换 为 可 打印 的 形式 。 


22.3 ”准备 打印 文件 


作为 命令 行 用 户 ， 我 们 多 数 还 是 倾向 于 打印 文本 文件 ， 虽 然 其 他 的 数据 形 
式 也 可 以 打印 。 
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22.3.1 pr 一 一 将 文本 文件 转换 为 打印 文件 


前 面 章节 略微 介绍 了 pr 的 相关 知识 ， 本 节 将 讨论 其 与 打印 操作 联合 使 用 时 
用 到 的 一 些 参数 选项 。 在 前 面 打印 机 简 史 这 一 节 中 ， 我 们 介绍 了 基于 字符 的 打 
印 机 使 用 等 宽 字 体 使 得 每 页 有 固定 数目 的 行 并 且 每 行 有 固定 的 字符 数 。pr 则 用 
于 调整 文本 以 适应 特定 纸张 的 大 小 ， 并 且 可 自主 选择 页 届 和 页 边 距 。 下 表 22-1 
总 结 了 较 常 使 用 的 一 些 选项 。 


表 22-1 常见 的 pr 选项 


选项 功能 描述 

+first[:last] 输出 一 个 从 first 开始 以 last 结束 的 页 范围 

-columns 将 页 的 内 容 分 成 指定 的 columns 列 

二 默认 情况 下 ， 多 列 输出 是 垂直 列 出 的 。 通 过 增加 -a〈across) 选项 ， 内 容 便 是 水 
平 列 出 

-d 隔行 打印 输出 

et 用 format 格式 来 格式 化 页 眉 的 显示 日 期 ,可 以 查看 日 期 命令 的 man 手册 页 以 了 
解 格式 字符 串 的 描述 

f 使 用 换 页 符 而 不 是 回 车 符 作为 页 与 页 之 间 的 分 隔 符 

-h header 在 页 层 的 中 间 部 分 ， 使 用 header 代替 正在 处 理 的 文件 名 

-llength 将 页 的 长 度 设 为 length。 默 认 是 66 行 〈 按 每 英寸 有 6 行 的 美式 字母 算 ) 

-n 对 行进 行 编号 

-0 offset 创建 一 个 有 offset 字符 宽 的 左 页 边 距 

-w width 设 定 页 面 宽 度 为 width， 默 认 是 72 个 字符 


Pr 通常 用 于 管道 传输 的 过 滤器 。 下 面 例子 生成 了 一 个 /usr/bin 文件 夹 下 的 目 
录 列 表 ， 并 用 pr 将 其 格式 化 为 分 页 的 、 三 列 的 输出 。 


[meelinuxbox ~]$ ls /usr/bin | pr -3 -w 65 | head 


2012-02-18 14:00 Page 1 
[ 


apturl bsd-write 
411toppm ar bsh 


a2p arecord btcflash 
a2ps arecordmidi bug-buddy 
a2ps-1pr-wrapper ark buildhash 


22.4 癌 打 印 机 发 送 打 印 任务 


CUPS 打印 组 件 支持 两 种 打印 方法 ， 它 们 都 是 类 UNIX 系统 过 去 使 用 过 的 。 
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22.4.1 


一 种 方法 叫做 Berkeley 或 LPD (UNIX 的 Berkeley 软件 发 行 版 本 中 使 用 的 )， 
运用 的 是 lpr 命令 ; 另外 一 种 方法 叫做 SysV (来 源 于 UNIX 的 System V 版 本 )， 
运用 的 是 中 命令。 这 两 个 命令 大 致 做 着 相同 的 事情 ， 用 户 可 依据 个 人 喜好 选 
择 使 用 。 


Ipr 一 一 打印 文件 ( Berkeley 类 型 ) 


lpr 命令 可 以 将 文件 传送 至 打印 机 ， 同 时 由 于 其 支持 标准 输入 ， 所 以 也 可 用 
于 管道 传输 。 例如， 要 打印 上 述 的 多 列 目录 列表 ， 我 们 可 以 进行 如 下 操作 。 


[me@linuxbox ~]$ 1s /usr/bin | pr -3 | lpr 

该 报告 将 被 送 至 系统 默认 的 打印 机 。 如 果 想 将 文件 发 送 至 不 同 的 打印 机 ， 
可 以 使 用 -P 选项 ， 示 例如 下 。 
lpr -P printer_name 

此 处 printer_name 是 指 目标 打印 机 的 名 称 。 可 以 用 下 面 的 命令 行 查看 系统 
打印 机 列表 。 


[me@linuxbox ~]$ lpstat -a 


许多 Linux 发 行 版 本 可 以 定义 一 个 “虚拟 打印 机 ”， 以 输出 PDF 格式 的 
文件 ， 而 不 是 在 真正 的 物理 打印 机 上 打印 ， 这 一 特性 可 以 方便 地 用 于 实践 打 
印 命令 。 检 查 打 印 机 设置 程序 可 以 判断 系统 是 否 支 持 这 一 设置 。 对 于 某 些 发 
行 版 本 ， 你 可 能 会 需要 安装 额外 的 软件 包 (比如 像 cups-pdf 软件 包 ) 以 支持 
这 一 特性 。 


表 22-2 列 出 了 lpr 的 常用 选项 。 
” 表 22-2 常用 的 lpr 选 项 


选项 功能 描述 
-# number 打印 number 份 副本 

人 每 一 页 都 将 包括 日 期 、 时 间 、 工 作 名 称 和 页 码 的 页 眉 用 阴影 打印 出 来 。 这 种 所 
谓 的 “优质 打印 ”选项 可 以 用 于 打印 文本 文件 


指定 用 于 打印 输出 的 打印 机 名 。 如 果 未 指定 打印 机 ， 那 就 是 用 系统 默认 的 打 
印 机 


-P printer 


- 打印 结束 后 删除 文件 。 此 选项 适用 于 那些 产生 临时 打印 输出 文件 的 程序 
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22.4.2 Ip 一 一 打印 文件 ( System V 类 型 ) 


与 jpr 类 似 ，lp 命令 既 支 持 文件 输入 也 支持 标准 输入 。 它 与 lpr 的 不 同 之 
处 在 于 它 有 一 个 不 同 〈 稍 微 复杂 点 ) 的 参数 选项 设置 。 表 22-3 列 出 了 常用 的 


选项 。 


表 22-3 常见 的 lp 选项 


选项 

-d printer 

-n number 
-0 landscape 
-0 fitplot 


说 明 

设置 目标 打印 机 为 printer。 如 果 未 指定 -d 选项 ， 将 会 使 用 系统 默认 的 打印 机 
打印 number 份 副 本 

将 输出 设置 为 横向 

根据 页 面 大 小 缩放 文件 。 这 在 打印 诸如 JPEG 文件 时 非常 有 用 


设 定 文件 缩放 比例 为 number。 如 果 该 值 为 100， 则 正好 填充 一 页 纸 ， 如 果 该 


-0 scaling=number 值 小 于 100， 那 么 一 页 纸 将 填 不 满 ， 如 果 该 值 大 于 100， 则 打印 内 容 将 打印 在 
多 个 页 面 上 
-0 cpi=number 设置 每 英寸 输出 字符 数位 number。 默 认 是 10 


-0 lpi=number 设 定 每 英寸 输出 指定 number 的 行 ， 默 认 是 6 
-0 page-bottom=points 
-0 page-left=points 
-0 page-right=points 
-0 page-top=points 


设置 页 边 距 。 其 值 以 点 的 形式 表示 ， 点 是 排版 测量 单位 ， 每 英寸 有 72 个 点 


指定 页 列表 。 页 的 表达 形式 可 以 为 用 逗号 隔 开 的 页 列表 或 是 以 “一 ”表示 的 
页 范围 ， 如 1,3,5,7-10 


-P pages 
让 我 们 重新 生成 目录 清单 ， 此 次 打印 的 规格 为 12CPI (字符 /类 寸 ) 和 8LPI 
《 行 /英寸 )， 并 且 左 边 距 为 0.5 英寸 。 请 注意 ， 考 虑 到 需要 适应 新 的 页 面 大 小 ， 
所 以 必须 调整 pr 的 参数 选项 。 


[me@linuxbox ~]$ 18 /usr/bin | pr -4 -w 90 -1 88 | lp -0 page-left=36 -0 cpi= 
12 -0 lpi=8 


该 管道 使 用 了 比 默认 规格 更 小 的 字体 从 而 得 到 了 一 个 4 列 列表 。 每 行 增加 
的 字符 数 使 得 一 页 纸 中 能 够 容纳 更 多 列 。 


22.4.3 另外 一 个 参数 选项 : a2ps 


a2ps 是 一 个 非常 有 趣 的 命令 ， 从 其 命令 名 中 可 以 看 出 它 是 一 个 格式 转换 程 
序 , 但 其 功能 远 不 止 这 些 。 该 名 称 原 义 是 指 将 ASCI 格式 转化 为 PostScript 格式 ， 
并 且 用 于 为 PostScript 打印 机 上 的 打印 任务 准备 文本 文件 。 然 而 ， 随 着 时 间 的 推 
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移 ， 该 程序 的 功能 不 断 扩 大 ， 至 今 已 可 以 将 任何 格式 的 文件 转化 为 PostScript 
格式 了 。 尽 管 表面 上 看 起 来 它 是 一 个 格式 转换 程序 ， 但 其 实际 是 一 个 打印 程序 。 
它 会 将 默认 输出 而 非 标准 输出 送 至 系统 默认 的 打印 机 。 该 程序 默认 使 用 的 是 “ 优 
质 打印 机 ”模式 ， 也 就 是 说 会 自动 优化 输出 内 容 的 可 视 性 。 我 们 可 以 用 该 程序 
在 桌面 上 创建 一 个 PostScript 文件 。 


[meelinuxbox ~]$ ls /usr/bin | pr -3 -t | a2ps -0 ~/Desktop/ls.ps -L 66 


[stdin (plain): 11 pages on 6 sheets] 
{Total: 11 pages on 6 sheets] saved into the fiie '/home/me/Desktop/l1s.ps’ 


该 命令 行 用 pr 过 滤 了 该 文本 流 ， 使 用 -t 选项 (省略 了 页 眉 页 脚 ), 然后 使 用 
a2ps 指定 了 一 个 每 页 66 行 〈-L 选项 ) 的 输出 文件 〈-o 选项 ) 以 匹配 pr 的 分 页 
输出 。 如 果 我 们 选用 合适 的 文件 浏览 器 查看 其 输出 结果 ， 可 以 看 到 下 图 22-1 的 

内 容 。 


多 6 | of6 [Fit page width 3 
Next 一 一 ‘ 


| Thumbnails = BT 


Puinted by William Shotls 
Page 2711 


Feb 如 ,09 区 者 stdin Page 111 | 


aztsace 
Sunday February 22, 2009 


22-1 a2ps 命令 的 输出 内 容 


可 以 看 到 ， 默 认 的 输出 布局 是 “ 双 面 ” (“two up”) 格式 ， 也 就 是 两 页 纸 的 
内 容 会 在 一 张 纸 的 正 反面 打印 。a2ps 会 自动 应 用 美观 的 页 丑 和 页 脚 。 


第 22 章 打印 289 


a2ps 有 许多 选项 ， 表 22-4 总 结 了 一 些 。 


表 22-4 a2ps 选项 


选项 功能 描述 

--center-title text 将 中 心 页 标题 设 为 text 
--columns number 将 页 分 成 mn 列 。 默 认 值 是 2 
--footer text 设置 页 脚 内 容 为 text 


~-guess 


--left-footer text 
--left-title text 
~-line-numbers=interval 


-list=defaults 


--list=topic 


--pages range 
--right-footer text 
--Tight-title text 
--rows number 
-B 

-b text 


-f size 
-| number 


-L number 
-M name 
-n number 
-0 file 

-P printer 
-R 

-r 

-T number 


-u text 


给 出 输入 文件 的 类 型 。 因 为 a2ps 试图 转换 以 及 格式 化 所 有 类 型 的 数据 ， 该 
选项 可 以 用 于 在 给 定 了 具体 文件 的 情况 下 ， 告 诉 a2ps 下 一 步 做 什么 


将 左 页 脚 内 容 设 为 text 

将 左 页 标题 设置 为 text 

每 interval 的 间隔 对 输出 文件 进行 编号 

显示 默认 设置 

显示 topic 的 设置 ， 这 里 的 topic 可 以 是 下 面 的 一 种 ， 委 托 《 用 于 转换 数据 的 外 部 


程序 )、 编 码 、 属 性 、 变 量 、 媒 介 纸张 大 小 及 其 类 似 的 设置 )、ppd (Postscript 打 
印 机 描述 )、 打 印 机 、 序 言 〈 位 于 正常 输出 前 面 的 代码 段 )、 样 式 表 、 用 户 选 项 


打印 range 范围 内 的 内 容 
设置 右 页 脚 内 容 为 text 
设置 右 页 标题 内 容 为 text 
将 页 面 分 成 number 行 。 默 认 值 是 1 
无 页 收 

设置 页 眉 内 容 为 text 

使 用 size 点 的 字体 


设置 每 行 有 number 个 字符 。 该 选项 和 下 面 的 -L 选项 可 以 用 于 诸如 pr 等 的 其 
他 命令 的 分 页 处 理 ， 以 适应 打印 纸张 的 大 小 


设置 每 页 有 number 行 

使 用 名 为 name 的 纸张 大 小 ， 例 如 A4 

打印 n 份 副本 

将 输出 内 容 送 至 file。 如 果 指 定 file 是 1， 则 是 标准 输出 

使 用 printer 打印 机 ， 如 果 并 未 指定 任何 打印 机 ， 那 么 就 使 用 系统 的 默认 打印 机 
纵向 排版 

横向 排版 

设置 制 表 符 tab 作为 每 一 个 数字 字符 的 结尾 

采用 底 图 (水印) 技术 打印 文本 纸张 


该 表 仅 仅 是 一 个 简单 的 概括 ，a2ps 还 有 很 多 其 他 选项 。 
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注意 人 们 仍 在 积极 开发 a2ps 程序 .就 我 使 用 a2ps 的 经 历 而 言 ,不 同 Linux 发 行 
版 本 中 a2ps 有 着 不 同 的 表现 。 在 CentOS 4 系统 上 ， 默 认输 出 为 标准 输出 。 在 
CentOS 4 和 Fedora 10 系统 上 , 尽管 程序 已 经 设置 默认 使 用 信封 大 小 的 纸张 ,但 
其 默认 输出 仍 为 A4 大 小 的 纸张 . 诚然 , 这 些 问 题 可 以 通过 详细 地 定义 所 需要 的 
参数 选项 来 解决 。 在 Ubuntu 8.04 系统 上 ，a2ps 则 表现 得 如 前 面 所 记录 的 一 样 。 
还 要 注意 的 是 ， 有 另外 一 种 将 文本 转化 为 PostScript 的 工具 叫做 enscript。 
它 可 以 进行 许多 与 a2ps 同样 的 格式 化 和 打印 操作 ， 不 同 的 是 它 只 支持 文本 输入 。 


22.5 ”监测 和 控制 打印 任务 


与 UNIX 打印 系统 类 似 ，CUPS 也 是 以 处 理 来 自 多 用 户 的 多 项 打印 任务 而 设 
计 的 。 每 个 打印 机 都 有 一 个 打印 队列 ， 打 印 任 务 排列 其 中 等 待 被 送 至 打印 机 打 
印 。CUPS 提供 了 几 个 用 于 管理 打印 机 状态 和 打印 队列 命令 行 的 程序 。 与 jpr 和 
lp 程序 类 似 ， 这 些 管理 程序 都 是 以 Berkeley 和 System V 打印 系统 相应 的 程序 为 
原型 的 。 


22.5.1 Ipstat 一 一 显示 打印 系统 状态 


lpstat 程序 可 以 确定 系统 中 打印 机 的 名 称 和 可 用 性 。 例 如 ， 假 定 一 台 打 印 系 
统 ， 既 有 物理 打印 设备 〈 叫 做 printer)， 也 有 PDF 虚拟 打印 机 《〈 叫 作 PDF)， 那 
么 便 可 以 用 下 面 的 命令 行 检查 它们 各 自 的 状态 。 
Ime@linuxbox ~]$ lpstat -a 


PDF accepting requests since Mon 05 Dec 2011 03:05:59 PM EST 
printer accepting requests since Tue 21 Feb 2012 08:43:22 AM EST 


更 进一步 ， 我 们 可 以 用 下 面 的 方式 得 到 更 具体 的 打印 系统 配置 描述 。 


[me@linuxbox ~]$ lpstat -s 

system default destination: printer 

device for PDF: cups-pdf:/ 

device for printer: ipp://print-server:631/printers/printer 


本 例 中 ，printer 是 系统 默认 的 打印 机 ， 同 时 它 也 是 一 个 利用 网 络 打印 协议 
《ipp://) 与 一 个 叫做 print-server 的 系统 连接 的 网 络 打印 机 。 


表 22-5 中 描述 了 lpstat 的 常用 选项 。 
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表 22-5 常用 的 jpstat 选项 
选项 功能 描述 


; 显示 printer 打印 机 的 打印 队列 状态 。 请 注意 ， 该 状态 显示 的 是 打印 队列 接受 打印 任务 的 
-aprinter-] 。 能力 ， 而 不 是 物理 打印 机 的 状态 。 如 果 未 指定 打印 机 ， 所 有 的 打印 队列 都 会 显示 出 来 


-d 显示 系统 默认 的 打印 机 名 
-p [printer...] ”显示 指定 的 printer 状态 。 如 果 未 指定 打印 机 ， 所 有 的 打印 机 都 会 显示 出 来 
-r 显示 打印 服务 器 的 状态 
-S 显示 状态 汇总 报告 
-t 显示 一 个 完整 的 状态 报告 
22.5.2 Ipq 一 一 显示 打印 队列 状态 


我 们 可 以 使 用 tpq 程序 查看 一 个 打印 队列 的 状态 ， 该 程序 可 以 查看 打印 机 队 
列 状态 及 其 所 包含 的 打印 任务 。 如 下 为 系统 默认 的 打印 机 printer 的 一 个 空 队列 。 


[me@linuxbox -]$ 1pq 
printer is ready 
no entries 


如 果 事 先 并 未 指定 打印 机 “使 用 -P 选项 )， 系 统 便 会 显示 默认 的 打印 机 。 如 
果 向 打印 机 发 送 打印 任务 ， 然 后 查看 打印 队列 ， 便 会 看 到 如 下 列表 。 


[me@linuxbox ~]$ ls *.txt | pr -3 | lp 

request id is printer-603 (1 file(s)) 

[me@linuxbox ~]$ lpq 

printer is ready and printing 

Rank Owner Job File(s) Total Size 
active me 603 (stdin) 1024 bytes 


22.5.3 1Iprm 与 cancel 一 一 删除 打印 任务 


CUPS 提供 了 两 个 用 于 终止 打印 任务 并 将 它们 从 打印 队列 中 移 除 的 程序 。 其 
中 一 个 就 是 Berkeley 类 型 的 prn， 另 外 一 个 是 System V 的 cancel。 它 们 在 所 支 
持 的 参数 选项 上 有 稍 许 不 同 ， 但 基本 上 实现 的 是 同样 的 功能 。 以 上 面 例子 中 使 
用 的 打印 任务 为 例 ， 将 该 打印 任务 终止 并 移 除 ， 可 以 使 用 如 下 命令 行 。 


[me@linuxbox ~]$ cancel 603 
{me@linuxbox ~]$ 1pq 
printer is ready 

no entries 


这 两 个 命令 都 提供 了 一 些 选项 ， 用 于 移 除 属于 一 个 特定 用 户 、 特 定 打印 机 以 及 
多 个 任务 号 的 所 有 打印 任务 ， 它 们 各 自 的 man 手册 页 都 详细 介绍 了 其 用 法 。 
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编译 程序 


本 章 将 介绍 如 何 通 过 源 代码 生成 可 执行 程序 。 开 放 源 代码 是 Linux 自由 开 
源 的 必要 因素 ， 整 个 Linux 系统 的 开发 依赖 于 开发 人 员 之 间 的 自由 交流 。 对 于 
多 数 桌面 系统 用 户 来 说 ， 编 译 已 经 是 一 门 失 传 的 艺术 。 编 译 技 术 虽 然 曾 经 非常 
普遍 ， 但 是 如 今 ， 版 本 发 行商 却 维护 着 很 大 的 预 编译 二 进 制 库 ， 以 便 用 户 下 载 
使 用 。 在 本 书 编写 之 时 ，Debian 系统 的 预 编译 库 ( 所 有 Linux 发 行 版 中 最 大 的 
库 之 一 ) 包含 了 近 23000 个 软件 包 。 


那么 ， 为 什么 要 编译 软件 呢 ? 有 如 下 两 个 原因 。 

。 可 用 性 : 尽管 有 些 发 行 版 已 经 包含 了 版 本 库 中 的 一 些 预 编译 程序 ， 但 并 不 
会 包含 用 户 所 有 可 能 需要 的 应 用 程序 。 这 种 情况 下 ， 用 户 获 取 所 需要 软件 
的 唯一 方式 就 是 编译 源 代码 。 

。 及 时 性 : 虽然 有 些 发 行 版 本 专注 于 一 些 前 沿 的 程序 版 本 , 但 是 多 数 并 不 会 。 
这 就 意味 着 想 要 获取 最 新 版 本 的 程序 ， 编 译 是 必 不 可 少 的 。 


编译 软件 源 代 码 是 一 项 非常 复杂 并 而 有 技术 性 的 任务 , 这 远 远 超 出 了 多 数 用 户 
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的 能 力 范围 。 然 而 ， 仍 有 许多 非常 简单 的 编译 任务 ， 只 需要 几 个 步骤 即 可 完成 。 编 
译 的 复杂 程度 完全 取决 于 所 要 安装 的 软件 包 。 本 章 会 介绍 一 个 非常 简单 的 例子 ， 从 
而 让 大 家 对 编译 过 程 有 一 个 大 致 了 解 ， 并 为 那些 准备 深入 学 习 的 人 打下 基础 。 


本 章 会 介绍 一 个 新 的 命令 。 
。 make 一 维护 程序 的 工具 。 


23.1 什么 是 编译 


简单 来 说 ， 编 译 就 是 一 个 将 源 代码 (由 程序 员 编 写 的 人 类 可 读 的 程序 描述 ) 
翻译 成 计算 机 处 理 器 能 识别 的 语言 的 过 程 。 

计算 机 处 理 器 (或 CPU) 在 一 个 非常 基础 的 层次 上 工作 ， 只 能 运行 称 之 为 
机 器 语言 的 程序 。 而 机 器 语言 其 实 就 是 一 些 数值 代码 ， 它 描述 的 都 是 一 些 非常 
小 的 操作 ， 比 如 “增加 某 个 字 节 ”、“ 指 向 内 存 中 某 个 位 置 ”或 者 “复制 某 个 字 
节 ” 等 ， 并 且 每 一 个 这 样 的 指令 都 是 以 二 进 制 (0 和 1) 的 形式 表示 的 。 最 早 的 
计算 机 程序 就 是 用 这 样 的 数值 代码 编写 ， 这 也 许可 以 解释 为 什么 写 这 些 数值 代 
码 的 程序 员 吸 很 多 烟 ， 喝 大 量 咖啡 ， 戴 着 厚重 的 眼镜 。 


汇编 语言 的 出 现 解决 了 这 一 问题 ， 因 为 它 用 诸如 CPY 复制) 和 MOV ( 转 
移 ) 等 更 容易 的 助 记 符 取代 了 那些 数值 代码 ， 汇 编 语 言 编写 的 程序 会 由 汇编 程 
序 〈assembler) 处 理 成 机 器 语言 。 如 今 ， 汇 编 语 言 仍 然 用 于 某 些 专门 的 编程 任 
务 ， 诸 如 设备 驱动 和 嵌入 式 系统 等 。 

之 后 出 现 了 高 级 编程 语言 ， 被 称 为 高 级 语言 是 因为 它们 可 以 让 程序 员 少 关 
注 些 处 理 器 的 操作 细节 而 把 更 多 的 精力 集中 在 解决 手头 的 问题 上 。 早 期 (20 世 
纪 50 年 代 开 发 的 ) 的 高 级 语言 包括 FORTRAN ( 专 为 科学 技术 任务 设计 )〉 和 
COBOL 〈 专 为 商务 应 用 设计 )， 两 者 至 今 仍然 在 某 些 专门 领域 发 挥 荐 作用 。 

虽然 现在 流行 的 编程 语言 有 很 多 ， 但 有 两 个 占据 着 主导 地 位 ，C 和 C++ 便 
是 多 数 现代 系统 采用 的 编程 语言 。 下 面 的 内 容 中 ， 我 们 编译 了 一 个 C 语言 程序 
作为 例子 进行 讲解 。 

高 级 语言 编写 的 程序 通过 编译 器 转换 为 机 器 语言 。 有 些 编译 器 则 将 高 级 语 
言 程序 转换 为 汇编 语言 ， 然 后 再 使 用 一 个 汇编 程序 (assembler) 将 其 转换 为 机 
器 语言 。 

经 常 与 编译 一 起 使 用 的 步骤 就 是 链接 。 程 序 执行 着 许多 共同 的 任务 。 例 如 ， 打 
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开 一 个 文件 , 许多 程序 都 会 需要 进行 此 操作 。 如 果 每 个 程序 都 采用 自己 的 方式 实现 
该 功能 的 话 便 是 一 种 浪费 。 编写 一 个 用 于 打开 文件 的 单个 程序 ， 并 人 允许 其 他 程序 共 
享 它 , 反而 更 有 意义 。 提 供 这 种 通用 任务 支持 功能 的 便 是 库 , 库 中 包含 了 多 个 例 程 ， 
每 一 个 实现 的 都 是 许多 程序 能 够 共享 的 通用 任务 。 在 /lib 和 /usr/lib 目录 中 ， 我 们 可 
以 发 现 很 多 这 样 的 程序 。 链 接 器 〈linker) 程序 可 以 实现 编译 器 的 输出 与 编译 程序 
所 需要 库 之 间 的 链接 。 该 操作 的 最 后 结果 就 是 生成 一 个 供 使 用 的 可 执行 文件 。 


23.2 是 不 是 所 有 的 程序 都 需要 编译 


答案 是 否定 的 。 我 们 都 知道 ， 有 些 程序 ， 如 shell 脚本 ， 可 以 直接 运行 而 不 
需要 编译 ， 这 些 文件 都 是 用 脚本 或 解释 型 语言 编写 的 。 这 些 语言 在 近 些 年 来 越 
来 越 受 欢迎 ， 其 中 就 有 Perl、Python、PHP、Ruby 以 及 其 他 多 种 语言 等 。 


脚本 语言 由 一 个 称 为 解释 器 的 特殊 程序 来 执行 ， 解 释 器 负责 输入 程序 文件 
并 执行 其 所 包含 的 所 有 指令 。 通 常 来 讲 ， 解 释 型 程序 要 比 编译 后 的 程序 执行 起 
来 慢 。 这 是 因为 在 解释 型 程序 中 ， 每 条 源 代 码 指令 在 执行 时 都 要 重新 翻译 一 次 
该 源 代 码 指令 。 然 而 在 编译 后 的 程序 中 ， 每 条 源 代 码 指 令 只 翻译 一 次 ， 并 且 该 
翻译 结果 将 永久 地 记录 到 最 后 的 可 执行 文件 中 。 


那 为 什么 解释 型 语言 如 此 受 欢 迎 ? 其 实 对 于 许多 日 常 的 编程 工作 ， 解 释 型 
程序 的 执行 速度 也 是 足够 的 ， 而 其 真正 的 优点 在 于 开发 解释 型 程序 要 比 开发 编 
译 程序 简单 而 迅速 得 多 。 程 序 开发 总 是 经 历 着 这 样 一 个 重复 的 循环 一 一 编码 、 
编译 和 测试 。 随 着 程序 规模 的 逐渐 扩大 ， 编 译 时 间 也 逐渐 变 长 。 解 释 型 程序 则 
省 略 了 编译 这 一 过 程 ， 因 此 加 速 了 程序 的 开发 。 


23.3 ”编译 一 个 C 程序 


现在 我 们 可 以 编译 程序 了 。 然 而 ， 在 执行 编译 操作 前 ， 需 要 一 些 工 具 ， 诸 
如 编译 器 、 链 接 器 以 及 make 等 。gcc 《GNU C 编译 器 ) 是 Linux 环境 中 通用 的 
C 编译 器 ， 最 初 是 由 Richard Stallman 编写 的 。 多 数 Linux 发 行 版 本 并 不 会 默认 
安装 gcc， 我 们 可 以 用 下 面 的 命令 行 查看 系统 是 否 安装 了 该 编译 器 。 


[meelinuxbox ~]$ which gcc 
/usr/bin/gcc 


该 例子 的 结果 表明 已 安装 了 此 编译 器 。 
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注意 


你 所 使 用 的 Linux 版 本 也 许 提供 了 一 个 用 于 软件 开发 的 元 数据 包 (一 个 软 
件 包 集 )。 如 果 这 样 ， 你 可 以 直接 安装 该 软件 包 便 可 在 系统 上 编译 程序 。 但 如 果 
你 的 系统 并 未 提供 该 元 数据 包 ， 则 只 能 自己 安装 gcc 和 make 软件 包 。 当 然 ， 针 
对 多 数 发 行 版 本 ， 安 装 这 两 个 软件 包 已 经 足够 执行 接 下 来 的 例 程 。 


23.3.1 获取 源 代 码 


注意 


从 一 个 叫做 diction 的 GNU 项 目 中 选择 一 个 程序 进行 编译 练习 ， 这 个 方便 短 
小 的 程序 一 般 用 于 检查 文本 文件 的 质量 和 写作 风格 ， 它 非常 小 并 且 很 容易 生成 。 


依据 惯例 ， 我 们 首先 创建 一 个 src 目录 用 于 存放 源 代 码 ， 然 后 使 用 ftp 下 载 
源 代码 至 该 目录 。 


[me@linuxbox ~]1$ mkdir src 
[meelinuxbox ~]$ cd srec 

[me@linuxbox src]$ ftp ftp.gnu.org 
Connected to ftp.gnu.org. 

220 GNU FTP server ready . 

Name (ftp.gnu.org:me): anonymous 

230 Login successful. 

Remote System type is UNIX. 

Using binary mode to transfer files. 
ftp> cd gnu/diction 

250 Directory successfully changed. 
ftp> 1s 

200 PORT command successful. Consider using PASVY., 
150 Here comes the directory listing. 


-Pw-r--r-- 1 1003 65534 68940 Aug 28 1998 diction-0.7.tar.gz 
-MW-r--r-- 1 1003 65534 90957 Mar 04 2002 diction-1.02.tar.gz 
-FwW-r--r-- 1 1003 65534 141062 Sep 17 2007 diction-1.11.tar.gz 


226 Directory send OK. 

ftp> get diction-1.11.tar.gz 

local: diction-1.11.tar.gz remote: diction-1.11.tar.gz 
200 PORT command successful. Consider using PASV. 

150 Opening BINARY mode data connection for diction-1.11.tar.gz (141062 
bytes). 

226 File send OK. 

141062 bytes received in 0.16 secs (847.4 KkB/s) 

ftp> bye 

221 Goodbye. 

{me@linuxbox src]$ 1s 

diction-1.11.tar.gz 


”由 于 编译 源 代码 时 我 们 便 是 源 代码 的 维护 者 ， 所 以 我 们 将 其 存放 于 ~/src 目录 
中 。 发 行 版 本 自行 安装 的 源 代码 一 般 安 装 于 /usrsrc 目录 下 ， 而 面向 多 用 户 使 用 
的 源 代码 则 通常 安装 在 /usr/local/src 目录 中 。 
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可 以 我 们 看 到 ， 源 代码 通常 以 一 个 压缩 的 tar 文件 的 形式 存在 ， 有 时 被 称 
为 tarpa1， 该 文件 包含 了 源 代 码 树 ， 即 构成 该 源 代码 的 目录 及 文件 的 组 织 框架 。 
连接 到 FTP 站 点 后 ， 我 们 便 可 以 查看 可 用 的 tar 文件 列表 并 挑选 其 中 最 新 的 版 
本 进行 下 载 。 在 ftp 中 使 用 get 命令 ， 即 可 将 文件 从 FTP 服务 器 复制 到 本 地 主机 。 


下 载 了 该 tar 文件 后 ， 就 必须 对 其 进行 解压 缩 ， 这 是 通过 tar 程序 来 完成 的 : 


[me@linuxbox src]$ tar xzf diction-1.11.tar.gz 
fmeelinuxbox src]$ 1s 
diction-1,11 diction-1.11.tar.gz 


注意 该 diction 程序 与 所 有 其 他 GNU 项 目的 软件 一 样 , 都 遵循 一 定 的 源 代码 打 
包 标 准 ，Linux 系统 中 许多 其 他 可 用 的 源 代码 同样 遵循 这 样 的 标准 。 该 标准 规 
定 ， 当 源 代码 的 tar 文件 解压 缩 后 ,会 创建 一 个 包含 源 代 码 树 的 目录 ， 并 且 该 目 
录 以 project-x.xx 的 格式 命名 ， 此 格式 包含 了 该 项 目的 名 称 及 其 版 本 号 。 这 一 机 
制 有 助 于 实现 不 同 版 本 之 间 同 一 程序 的 安装 。 然 而 ， 在 解压 之 前 先 检查 源 代码 
树 的 布局 也 是 很 有 必要 的 ， 因 为 有 些 项 目 并 不 会 创建 目录 而 是 将 所 有 文件 直接 
送 至 当前 目录 , 这 可 能 会 给 原先 井然 有 序 的 src 目录 造成 混乱 。 为 了 避免 这 样 的 
事情 发 生 ， 我 们 可 以 使 用 下 面 的 命令 行 检查 tar 文件 的 内 容 。 


tar tzvf tarfile | head 


23.3.2 检查 源 代码 树 


解压 tar 文件 会 产生 一 个 新 的 目录 
树 ， 具 体内 容 如 下 。 


[meelinuxbox src]$ cd diction-1.11 
[me@linuxbox diction-1.11]$ ls 


diction-1.11。 该 目录 包含 了 源 文件 


config.guess diction.c getopt.c nl 
config.h.in diction.pot getopt.h nl1.po 
config.sub diction.spec getopt_int.h README 
configure diction.spec.in INSTALL sentence.c 
configure.in diction.texi.in install-sh sentence.h 
COPYING en Makefile.in style.1.in 
de en_GB misc.c style.c 
de.po en_GB.po misc.h test 
diction.1.in getopti.c NEWS 


此 解压 缩 包 中 包含 了 许多 文件 。 与 其 他 许多 程序 相似 ，GNU 项 目的 程序 也 
都 有 提供 如 README、INSTALL、NEWS 和 COPYING 等 这 些 文档 文件 。 这 些 
文件 包含 的 是 程序 的 描述 、 安 装 步骤 说 明 及 其 许可 条 款 。 在 着 手 生成 程序 前 ， 
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认真 阅读 README 和 INSTALL 文档 是 很 有 必要 的 。- 
此 目录 下 的 其 他 有 趣 文 件 便 是 这 些 以 .c 和 .h 结尾 的 文件 。 


[me@linuxbox diction-1.11]$ ls *.¢ 

diction.c getopti.c getopt.c misc.c Sentence.C style.c 
[me@linuxbox diction-1.11]$ ls *.h 

getopt.h getopt int.h misc.h sentence.h 


软件 包 提 供 的 两 个 C 程序 (style 和 diction) 便 是 以 .c 结尾， 并且 它 们 都 被 分 
成 了 多 个 模块 。 如 今 ， 这 种 将 一 些 大 的 程序 分 成 较 小 的 、 易 于 管理 的 小 程序 片 的 
做 法 已 是 司空 见 惯 。 这 些 源 代码 文件 都 是 普通 的 文本 文件 ， 可 以 用 less 查看 。 


{me@linuxbox diction-1.11]$ less diction.c 


.h 文件 是 大 家 熟知 的 头 文件 。 这 些 文件 ， 同 样 也 是 普通 的 文本 文件 。 头 文 
件 中 包含 了 对 源 代码 文件 或 库 中 的 例 程 的 描述 。 编译 器 在 链接 这 些 例 程 模块 时 ， 
必须 给 它 提供 一 个 其 所 用 到 的 所 有 模块 的 描述 。 因 此 ， 在 diction.c 的 开头 ， 可 
以 看 到 如 下 文本 行 。 
#include “getopt .hs" 

该 文本 行 会 指示 编译 器 在 读 取 diction.c 中 的 源 代 码 内 容 时 先 读 取 文件 
getopt.h 中 的 内 容 ， 进 而 读 取 getopt.c 中 的 内 容 。getopt.c 文件 包含 的 是 由 style 
和 diction 程序 所 共享 的 例 程 模块 。 


在 getopt.h 的 include 语句 上 面 ， 还 可 以 看 到 一 些 其 他 include 语句 ， 如 下 
所 示 。 | 


#include <regex.h> 
#include <stdio.h> 
#include <stdiib.h> 
#include <string.h> 
#include <unistd.h> 


这 些 都 是 用 来 引用 头 文件 ， 但 是 它们 引用 的 是 那些 不 在 当前 源 目 录 下 的 头 
文件 。 它 们 由 系统 提供 ， 为 每 个 程序 的 编译 提供 支持 。 如 果 查 看 /usr/include 目 
录 ， 便 会 看 到 如 下 内 容 。 


[me@linuxbox diction-1.11]$ ls /usr/include 


该 目录 下 的 头 文件 在 安装 编译 器 时 便 已 安装 。 


23.3.3 ”生成 程序 
大 多 数 程序 都 是 使 用 一 个 简单 的 两 行 命令 来 生成 的 。 
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./configure 
make 


configure 程序 其 实 是 源 代码 树 下 的 一 个 shell 脚本 ， 它 的 任务 就 是 分 析 生 
成 环境 。 多 数 源 代码 都 设计 成 可 移植 的 。 也 就 是 说 ， 源 代码 可 以 在 多 种 类 型 
的 UNIX 系统 上 生成 ， 只 是 源 代码 在 生成 时 可 能 需要 经 过 细微 的 调整 以 适应 
各 系统 之 间 的 不 同 。configure 同样 会 检查 系统 是 否 已 经 安装 了 必要 的 外 部 工 
具 和 组 件 。 


接 下 来 运行 configure。 由 于 configure 并 不 是 存放 于 shell 通常 期 望 程序 所 
在 的 目录 下 ,所 以 必须 显 式 告知 shell 有 关 configure 的 位 置 , 我们 可 在 命令 前 添 
加 “./” 目 录 符 来 实现 这 一 目的 。 该 符号 表示 configure 程序 位 于 在 当前 的 工作 
目录 下 。 


[me@linuxbox diction-1.11]$ ./configure 


configure 会 在 检查 以 及 配置 build 程序 的 同时 输出 许多 相关 信息 。 运 行 结束 
后 ， 会 输出 如 下 类 似 内 容 。 


checking libintl.h presence... yes 
checking for libint].h... yes 
checking for library containing gettext... none required 


configure: creating ./config.status 
config.status: creating Makefile 
config.status: Creating diction.1 
config.status: creating diction.texi 
config.status: creating diction.spec 
config.status: creating style.1 
config.status: creating test/rundiction 
config.status: creating config.h 
{me@linuxbox diction-1.11]$ 


需要 重点 注意 的 是 ， 这 里 并 没有 错误 信息 。 如 果 有 的 话 ， 该 configure 操作 
将 以 失败 告终 ， 并 且 不 会 生成 可 执行 程序 ， 直 到 所 有 的 错误 都 被 纠正 过 来 。 

可 以 看 到 ，configure 在 源 目 录 中 创建 了 几 个 新 文件 ， 其 中 最 重要 的 就 是 
Makefile。Makefile 是 指导 make 命令 如 何 生成 可 执行 程序 的 配置 文件 ， 如 果 没 
有 该 文件 ，make 便 无 法 运行 。Makefile 也 是 一 个 普通 的 文本 文件 ， 所 以 我 们 可 
以 用 less 查看 其 内 容 。 


[me@linuxbox diction-1.11]$ less Makefile 


make 程序 的 作用 其 实 就 是 输入 makefile (通常 叫做 Makefile)， 该 文件 描述 
了 生成 最 后 可 执行 程序 时 的 各 部 件 之 间 的 联系 及 依赖 关系 。 


makefile 的 第 一 部 分 内 容 定义 了 一 些 变量 ， 这 些 变量 在 makefile 的 后 面部 分 
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将 会 被 奉 换 掉 。 示 例如 下 。 


CC= gcc 

该 行将 C 编译 器 定义 为 gcc。 然 后 在 makefile 的 后 面 内 容 中 ， 我 们 可 以 看 
到 如 下 使 用 CC 的 例子 。 
diction: diction.0 Sentence.0 misc.0 getopt.0 getopt1.0 


$(CC) -0 $@ $(LDFLAGS) diction.o sentence.o misc.o \ 
getopt .0 getopt1.0 $(LIBS) 


该 例 中 包含 了 一 个 替代 操作 ， 在 运行 时 $(CC) 便 被 替换 为 gcc。 


大 多 数 makefile 文件 都 有 很 多 行 , 这 些 行 定 义 了 目标 文件 (在 本 例 中 是 diction 
可 执行 文件 )， 也 定义 了 目标 文件 所 依赖 的 一 些 文件 ， 剩 下 的 行 则 描述 的 是 那些 
将 原文 件 生成 目标 文件 的 命令 。 就 本 例 而 言 ， 我 们 可 以 看 到 可 执行 文件 diction 依 
赖 于 文件 diction.o、sentence.o、misc.o、getopt.o 以 及 getoptl.o 的 存在 。 继 续 查 
看 makefile 内 容 ， 我 们 可 以 看 到 这 些 目 标 文件 的 定义 。 


diction.o: diction.c config.h getopt.h misc.h sentence.h 
getopt.0: getopt.c getopt.h getopt int.h 

getopt1.0: getopt1.c getopt.h getopt int.h 

misc.o: misc.c config.h misc.h 

sentence.o: sentence.c config.h misc.h sentence.h 
style.o: style.c config.h getopt.h misc.h sentence.h 


然而 ， 我 们 并 没有 看 到 为 它们 指定 的 任何 命令 。 其 实 ， 它 们 是 由 文件 前 面 
的 一 个 总 体 目标 行 生成 的 ， 该 目标 行 描述 了 用 来 将 所 有 .c 文件 编译 为 .o 文件 的 
命令 。 


"CC.0: 
$(CC) -c $(CPPFLAGS) $ (CFLAGS) $< 


该 命令 行 看 起 来 确实 复杂 ， 那 为 什么 不 简单 地 列 出 编译 的 所 有 步骤 然后 照 
着 步骤 做 呢 ? 答案 即将 揭晓 。 揭 晓 前 ， 我 们 先 运行 make， 来 生成 我 们 的 程序 。 


[me@linuxbox diction-1.11]$ make 


make 程序 运行 时 ， 会 使 用 Makefile 文件 中 的 内 容 指导 其 操作 ， 其 间 会 产生 
许多 信息 。 


运行 结束 后 ， 我 们 会 看 到 所 有 的 目标 文件 都 出 现在 了 目录 中 。 


[me@linuxbox diction-1.11]$ 1s 


config.guess de.po en install-sh sentence.c 
config.h diction en_GB Makefile sentence.h 
config.h.in diction.1 en_GB .mo Makefile.in sentence.o 


config.109g diction.1.in en_GB.po misc.c style 


第 23 章 编译 程序 301 


config.status diction.c getopt1.c misc.h style.1 | 
config.sub diction.o getopt1.0o misc.o style.1.in 
configure diction.pot getopt.c NEWS style.c 
configure.in diction.spec getopt.h nl style.o 
COPYING diction.spec.in getopt_int.h nl .mo test 

de diction.texi getopt.o nl.po 

de.mo diction.texi,in INSTALL README 


在 这 些 文件 中 , 我 们 也 看 到 了 diction 和 style 程序 ,这 是 我 们 最 初 希望 生成 
的 。 是 不 是 应 该 庆祝 一 番 ， 因 为 我 们 刚刚 成 功利 用 源 代码 编译 了 第 一 个 可 执行 
程序 ! 


好 吧 ， 抑 制 住 好 奇 心 ， 再 次 运行 make 命令 。 


[meelinuxbox diction-1.11]$ make 
make: Nothing to be done for 'all'. 


仅仅 出 现 了 这 样 一 个 奇怪 的 信息 。 到 底 怎 么 回 事 ? 为 什么 它 没 有 再 次 生成 
该 程序 昵 ? 其 实 ， 这 便 是 make 的 神奇 之 处 。make 并 不 是 简单 盲目 地 重新 生成 
所 有 东西 ， 它 只 会 生成 那些 需要 生成 的 文件 。 在 所 有 的 目标 文件 已 经 存在 的 情 
况 下 ，make 会 判定 源 文件 没有 任何 改动 ， 也 就 不 会 进行 任何 操作 。 当 然 ， 可 以 
删除 其 中 某 个 目标 文件 ， 然 后 再 次 运行 make 以 观察 make 的 执行 情况 。 


[me@linuxbox diction-1.11]$ ra getopt.0 
[me@linuxbox diction-1.11]$ make 


可 以 看 到 ，make 重新 生成 了 getopt.o， 并 重新 链接 diction 和 style 程序 ， 因 
为 它们 都 依赖 于 被 删除 的 文件 .这 一 特性 同样 指出 了 make 的 另 一 个 用 法 一 一 可 
以 维护 目标 文件 的 更 新 。make 坚持 一 个 原则 ， 就 是 目标 文件 要 比 依赖 文件 新 。 
这 个 特性 有 着 重要 的 意义 。 因 为 程序 员 会 经 常 更 新 部 分 源 代码 ， 然 后 使 用 make 
生成 一 个 新 版 本 。make 能 够 确保 所 有 需要 基于 刚 更 新 的 代码 而 生成 的 程序 都 会 
生成 。 如 果 使 用 touch 命令 更 新 上 例 中 某 个 源 代 码 文件 ， 就 会 得 到 下 面 的 结果 。 


[me@linuxbox diction-1.11]$ 1s -1 diction getopt.c 
-Pwxr-xr-x 1 me me 37164 2009-03-05 06:14 diction 
-FWw-r--r-- 1 me me 33125 2007-03-30 17:45 getopt.c 
[meelinuxbox diction-1.11]$ touch getopt.c 

[me@linuxbox diction-1.11]$ ls -1 diction getopt.c 
-rwxr-xr-x 1 me me 37164 2009-03-05 06:14 diction 
-rw-r--r-- 1 me me 33125 2009-03-05 06:23 getopt.c 
[me@linuxbox diction-1.11]$ make 


make 运行 后 ， 可 以 看 到 目标 文件 已 经 比 依赖 文件 新 了 。 


[meelinuxbox diction-1.11]$ ls -1 diction getopt.c 
-Wxr-xr-x 1 me me 37164 2009-03-05 06:24 diction 
-rw-r--r-- 1 me me 33125 2009-03-05 06:23 getopt.c 
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make 能 够 智能 地 仅 生 成 需要 执行 building 操作 的 目标 文件 ， 这 一 能 力 让 程 
序 员 获 益 不 少 。 其 所 带 来 的 时 间 节 省 效益 ， 虽 然 对 于 一 些小 的 项 目 而 言 并 不 是 
那么 明显 ， 但 是 对 于 大 项 目 来 说 确 是 非常 重要 。 要 知道 ，Linux 内 核 〈 一 个 不 断 
进行 修改 和 完善 的 程序 ) 可 是 包含 儿 百 万 行 的 代码 。 


23.3.4 ”安装 程序 


打包 好 的 源 代码 一 般 包 含 一 个 特殊 的 make 目标 程序 ， 它 便 是 install。 该 目 
标 程 序 将 会 在 系统 目录 下 安装 最 后 生成 的 可 执行 程序 。 通 常 ， 会 安装 在 目录 
/usr/local/bin 下 ， 该 目录 是 本 地 主机 上 生成 软件 的 常用 安装 目录 。 然 而 ， 对 于 兽 
通用 户 ， 该 目录 通常 是 不 可 写 的 ， 所 以 必须 转换 成 超级 用 户 才 可 以 运行 安装 。 


[me@linuxbox diction-1.11]$ sudo make install 

安装 结束 后 ， 就 可 以 查看 该 程序 是 否 可 以 运行 。 
[me@linuxbox diction-1.11]$ which diction 
/usr/local/bin/diction 
[meelinuxbox diction-1.11]$ man diction 


在 安装 完 之 后 ， 便 可 以 使 用 该 应 用 该 程序 了 。 


23.4 ”本章 结尾 语 


本 章 中 我 们 介绍 了 三 个 简单 的 命令 ， 它 们 是 ./configure、make 和 make install， 
它们 可 以 用 于 建立 多 个 源 代码 软件 包 。 同 样 ， 我 们 还 介绍 了 make 在 软件 维护 的 过 
程 中 所 扮演 的 重要 角色 。make 程序 并 不 局 限于 源 代码 编译 ， 它 还 可 以 用 于 所 有 需 
要 维护 “目标 /依赖 ” 间 关 系 的 任务 。 


第 四 部 分 
编写 shell 脚本 


*04s 


编写 第 一 个 shell 脚本 


在 之 前 的 章节 中 , 我 们 已 经 学 习 了 一 系列 的 命令 行 工具 。 虽然 这 些 工 具 可 以 解 
决 很 多 计算 问题 ,但 是 我 们 在 使 用 它们 时 只 能 在 命令 行 中 一 个 一 个 手动 输入 。 如 果 
可 以 让 shell 完成 更 多 工作 ， 岂 不 是 更 好 ? 当然 可 以 。 通 过 自行 设计 ， 将 命令 行 组 
合成 程序 的 方式 , shell 就 可 以 独立 完成 一 系列 复杂 的 任务 。 我 们 可 以 通过 编写 shell 
脚本 方式 来 实现 。 


24.1 ”什么 是 shel 脚本 


最 简单 的 解释 是 ，shell 脚本 是 一 个 包含 一 系列 命令 的 文件 。shell 读 取 这 个 
文件 ， 然 后 执行 这 些 命令 ， 就 好 像 这 些 命令 是 直接 输入 到 命令 行 中 一 样 。 

shell 很 独特 ， 因 为 它 既 是 一 个 强大 的 命令 行 接口 ， 也 是 一 个 脚本 语言 解释 
器 。 我 们 将 会 看 到 ， 大 多 数 能 够 在 命令 行 中 完成 的 工作 都 可 以 在 脚本 中 完成 ， 反 
之 亦 然 。 
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我 们 已 经 讲解 了 许多 shell 特性 ， 但 我 们 关注 的 是 哪些 经 常 直接 在 命令 行 中 
使 用 的 特性 。shell 还 提供 了 一 些 通常 〈 但 不 总 是 ) 在 编写 程序 时 才 使 用 的 特性 。 


24.2 ”怎样 号 shell 脚本 


为 了 成 功 创建 和 运行 一 个 shell 脚本 ， 我 们 需要 做 三 件 事 情 。 

1. 编写 脚本 。shell 脚本 是 普通 的 文本 文件 。 所 以 我 们 需要 一 个 文本 编辑 器 来 
编辑 它 。 最 好 的 文本 编辑 器 可 以 提供 “语法 高 亮 ” 功 能 ， 从 而 能 够 看 到 脚本 
元 素 彩色 代码 视图 .“ 语 法 高 亮 ”可 以 定位 一 些 常 见 的 错误 。vim、gedit、 
kate 和 许多 其 他 的 文本 编辑 器 都 是 编写 shell 脚本 的 不 错 选择 。 

2. 使 脚本 可 执行 。 系 统 相 当 严 格 ， 它 不 会 将 任何 老式 的 文本 文件 当做 程序 。 
这 样 做 有 充足 的 理由 ! 所 以 我 们 需要 将 脚本 文件 的 权限 设置 为 允许 执行 。 

3. 将 脚本 放置 在 shell 能 够 发 现 的 位 置 。 当 没有 显 式 指定 路 径 名 时 ，shell 
会 自动 地 寻找 某 些 目录 ， 来 查找 可 执行 文件 。 为 了 最 大 程度 的 方便 ， 我 
们 会 将 脚本 放置 在 这 些 目录 下 。 


24.2.1 脚本 文件 的 格式 


为 了 保持 编程 的 传统 ， 我 们 将 创建 一 个 “hello world” 的 程序 ， 演 示 一 个 非 
常 简单 的 脚本 。 启 动 文本 编辑 器 并 且 输 入 以 下 脚本 。 
#1 /bin/bash 
# This is our first script. 
echo 'Hello Worldi 

这 个 脚本 的 最 后 一 行 看 起 来 非常 熟悉 ， 仅 仅 是 一 个 echo 命令 加 上 一 个 字符 
串 参数 。 第 二 行 也 很 熟悉 , 看 起 来 很 像 在 很 多 配置 文件 中 用 到 的 注释 行 . 就 shell 
脚本 中 的 注释 来 说 ， 它 们 可 以 放置 在 一 行 的 最 后 ， 如 下 所 示 。 
echo ‘Hello World!' # This is a comment too 


文本 行 中 ， 在 “#” 符 号 后 面 的 所 有 内 容 会 被 忽略 : 
很 很 多 命令 一 样 ， 它 也 是 在 命令 行 中 工作 : 


[me@linuxbox ~]$ echo “Hello Worldl' # This is a comment too 
Hello World! 


尽管 命令 行 中 的 注释 没有 用 ， 但 是 他 们 也 能 起 作用 。 
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脚本 的 第 一 行 看 起 来 有 点 神奇 。 由 于 它 以 符号 “#” 开 头 ， 看 起 来 像 是 注释 ， 
但 是 它 应 该 具有 一 定 的 意义 ， 所 以 它 不 仅仅 是 注释 。 实 际 上 ， 这 个 “ 胡 ” 字 符 
序列 是 一 种 特殊 的 结构 ， 称 之 为 shebang。shebang 用 来 告知 操作 系统 ， 执 行 后 
面 的 脚本 应 该 使 用 的 解释 器 的 名 字 。 每 一 个 shell 脚本 都 应 该 将 其 作为 第 一 行 。 


将 这 个 脚本 保存 为 hello_world。 


24.2.2 ”可 执行 权限 
下 一 步 要 做 的 事情 是 让 脚本 可 执行 。 使 用 chmod 命令 可 以 轻松 做 到 : 
[me@linuxbox ~]$ Is -1 hello world 
-rw-r--r-- 1 me me 63 2012-03-07 10:10 hello_world 
[me@linuxbox ~]$ chmod 755 hello_world 


[me@linuxbox ~]$ ls -1 hello world 
-rwxXr-xr-x 1 me me 63 2012-03-07 10:10 hello_world 


对 于 脚本 ， 有 两 种 常见 的 权限 设置 : 权限 为 755 的 脚本 ， 每 个 人 都 可 以 执 
行 ， 而 权限 为 700 的 脚本 ， 则 只 有 脚本 所 有 人 才能 执行 。 注 意 ， 为 了 能 够 执行 
脚本 ， 它 必须 是 可 读 的 。 


24.2.3 ”脚本 文件 的 位 置 
设置 完 权限 之 后 ， 现 在 来 执行 脚本 : 


[me@linuxbox ~]$ ./hello_world 
Hello World! 


为 了 使 脚本 运行 ， 我 们 必须 显 式 指定 脚本 文件 的 路 径 。 如 果 不 这 样 做 ， 我 
得 到 下 面 的 结果 : 


fmeelinuxbox ~]$ hello_world 
bash: hello world: command not found 


为 何 会 这 样 呢 ? 是 什么 让 脚本 有 别 于 程序 呢 ? 结果 证 明 ， 什 么 都 没有 。 脚 
本 本 身 没有 问题 ， 问 题 在 于 脚本 的 位 置 。 在 第 11 章 ， 我 们 讨论 了 PATH 环境 变 
量 ， 以 及 它 对 系统 搜索 可 执行 程序 方面 的 影响 。 如 果 没 有 显 式 指定 路 径 ， 则 系 
统 在 查找 可 一 个 执行 程序 时 ， 需 要 搜索 一 系列 目录 。 这 就 是 当 我 们 在 命令 行 中 
输入 ls 时 ， 系统 知 道 要 执行 /bin/ls 的 原因 。 /bin 目录 是 系统 会 自动 搜索 的 一 个 目 
录 。 目 录 列 表 存 放 在 名 为 PATH 的 环境 变量 中 。 这 个 PATH 变量 包含 一 个 由 冒 
号 分 隔 开 的 待 搜索 目录 的 列表 。 我 们 可 以 查看 PATH 的 内 容 : 


[me@linuxbox ~]$ echo SPATH 
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/home/me/bin: /usr/local/sbin: /usr/local/bin: /usr/sbin: /usr/bin:/sbin: /bin: /usr 
/games 


我 们 在 这 里 看 到 了 目录 列表 。 如 果 脚 本 位 于 该 列表 中 的 任何 一 个 目录 中 ， 
问题 就 解决 了 。 注 意 列表 中 的 第 一 个 目录 /home/me/bin。 大 多 数 Linux 发 行 版 会 
配置 PATH 变量 , 使 其 包含 用 户主 目录 中 的 bin 目录 ,允许 用 户 执行 他 们 自己 的 
程序 。 如 果 我 们 创建 了 bin 目录 ,并 且 将 脚本 放置 在 这 个 目录 内 ,该 脚本 应 该 就 
会 向 其 他 程序 那样 开始 运行 。 

[me@linuxbox ~]$ mkdir bin 
{me@linuxbox ~]$mv hello world bin 


[Ime@linuxbox ~]$ hello_world 
Hello World! 


如 果 PATH 环境 变量 不 包括 这 个 bin 目录 , 我 们 也 可 以 轻松 进行 添加 , 方法 
是 在 .bashrc 文件 中 增加 下 面 这 行 : 
export PATH=~/bin:"$PATH" 

修改 完毕 之 后 ， 它 会 在 每 一 个 新 的 终端 会 话 中 生效 。 为 了 将 这 一 修改 应 用 
到 当前 的 终端 会 话 ， 则 必须 让 shell 重新 读 取 .bashrc 文件 。 读 取 的 方式 如 下 。 
[meelinuxbox ~]$ 。 .bashrc 


这 个 “.” 命 令 和 source 命令 相同 ， 是 shell 内 置 命令 ， 用 来 读 取 一 个 指定 的 
shell 命令 文件 ， 并 将 其 看 做 是 像 从 键盘 中 输入 的 一 样 。 


在 Ubuntu 系统 中 ， 如 果 存 在 ~/bin 目录 ， 则 当 执 行 用 户 的 .bashrc 文件 


时 ，Ubuntu 系统 会 自动 将 ~/bin 目录 添加 到 PATH 变量 中 .。 所 以 ， 在 Ubuntu 
操作 系统 中 ， 如 果 创 建 了 ~/bin 目录 然后 退出 并 再 重新 登录 ， 一 切 也 会 正常 


运行 。 


24.2.4 脚本 的 理想 位 置 


~/bin 目录 是 一 个 存放 个 人 使 用 脚本 的 理想 位 置 。 如 果 我 们 编写 了 一 个 系统 
上 所 有 用 户 都 可 以 使 用 的 脚本 ， 则 该 脚本 的 传统 位 置 是 /usr/local/bin。 系 统管 理 
员 使 用 的 脚本 通常 放置 在 /usr/local/sbin。 在 大 多 数 情 况 下 ， 本 地 支持 的 软件 ， 无 
论 是 脚本 或 者 是 编译 好 的 程序 ， 应 该 放置 在 /usr/local 目录 下 ， 而 不 是 /bin 或 是 
/usr/bin 目录 下 。 这 些 目 录 都 是 由 Linux 文件 系统 层次 结构 标准 指定 的 ， 只 能 包 
含 由 Linxu 发 行商 所 提供 和 维护 的 文件 。 
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24.3 ”更 多 的 格式 诀窍 
之 所 以 严肃 认真 地 编写 脚本 ， 其 中 一 个 目的 是 为 维护 提供 便利 。 容 易 维护 


的 脚本 可 以 被 它 的 作者 或 其 他 人 员 进 行 修改 ， 以 适应 变化 的 要 求 。 而 让 脚本 易 
于 阅读 和 理解 是 一 种 方便 维护 的 方法 。 


24.3.1 ”长 选项 名 
我 们 学 习 的 很 多 命令 都 有 短 选项 名 和 长 选项 名 。 例 如 ，ls 命令 有 很 多 选项 ， 
它们 既 可 以 用 长 选项 名 表示 ， 也 可 以 用 短 选 项 名 表示 。 例 如 : 
[me@linuxbox ~]$ 13 -ad 
和 
{me@linuxbox -]$ 1s --8ll --directory 
这 两 个 命令 一 样 。 为 了 减少 输入 ， 当 在 命令 行 中 输入 选项 时 , 短 选项 更 可 取 。 
但 是 在 编写 脚本 时 ， 长 选项 名 可 以 提高 可 读 性 。 


24.3.2 ” 缩 进 和 行 连接 
当 使 用 长 选项 命令 时 ， 将 命令 扩展 为 好 几 行 ， 可 以 提高 命令 的 可 读 性 。 在 
第 17 章 中 ， 我 们 查看 了 一 个 特别 长 的 find 命令 示例 。 


tme@linuxbox ~]$ find playground \( -type f -not -perm 0600 -exec chmod 0600 
'{}' ;3' \) -or \( -type d -not -perm 0700 -exec chmod 0700 '{}' ';' \) 


乍 一 看 ， 该 命令 有 点 难以 理解 。 在 脚本 中 ， 如 果 以 如 下 方式 编写 ， 该 命令 
就 比较 容易 理解 了 。 
find playground \ 
\( 


-type f \ 


-not -perm 0600 \ 

-exec chmod 0600 '{}' ';' \ 
\) 
-or \ 
\( 

-type d \ 

-not -perm 0700 ‘\ 

-exec chmod 0700 '{}' ';' \ 
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通过 行 连接 符 《〈 反 和 斜 杠 - 回 车 符 序列 》 和 缩 进 ， 读 者 可 以 清楚 地 理解 这 个 复 
杂 命 令 的 逻辑 。 该 技术 在 命令 行 中 也 奏效 ， 但 是 很 少 使 用 ， 原 因 就 是 在 输入 和 
编辑 时 会 相当 麻烦 。 脚 本 和 命令 行 的 一 个 区 别 是 ， 脚 本 可 以 使 用 制 表 符 来 实现 
缩 进 ， 但 在 命令 行 中 ，Tab 键 用 来 激活 自动 补 齐 功能 。 


为 编写 脚本 而 配置 vim 
vim 文本 编辑 器 有 很 的 配置 项 。 有 几 个 常用 的 光 基 为 编写 认 本 提供 T 
方便 . 
er on” 用 来 打开 和 打开 这 个 所 项 后 ， ， dl 时 ， 不 
同 的 shell 语法 元 素 会 以 不 同 的 颜色 显示 。 这 对 于 识别 某 些 编程 错误 很 有 
它 看 起 来 也 很 酷 。 注意 , 为 了 使 用 这 种 功能 ， 必须 安装 vim 文本 编辑 器 的 完整 版 ， 
并 且 编 辑 的 文件 必 须 含 有 shebang 来 标识 这 是 一 个 shell Ut 如 果 无 法 设 
下 syntax on”， 可 以 试 试 “set syntax=sh”. 
“set health” 用 来 将 搜索 的 结 各 果 高 充 显 示 。 比如 我 们 查找 单 记 “echo” ) 
在 开启 该 选项 后 ， 内 则 所 有 的 “echo” 单 词 都 会 高 亮 显示 。 
” “iset tabstop=4” 用 来 设置 Tab 键 造成 的 ，， 默认 值 是 8 a 将 这 
个 值 设置 成 4， 会 让 长 文本 行 更 容易 适应 屏幕 。 
“:set autoindent” 用 来 开启 自动 缩 进 特性 . 这 个 选项 会 由， vim 对 新 的 一 行 
的 缩 进程 度 和 上 一 行 保持 一 致 。 对 很 多 编程 结 雪 构 0 这 就 加 快 了 输入 速度 ， 
要 停止 缩 进 ， 则 可 以 按 下 Ctrl-D。 ， 
通过 把 这 些 命令 ( 不 需要 前 面 的 国 本 字符 汪 加 到 -vim 文件 则 这 些 
改变 会 永久 生效 、 


24.5 “本章 结尾 语 


本 章 与 脚本 有 关 ， 我 们 介绍 了 如 何 编写 脚本 ， 以 及 如 何 轻松 地 在 系统 中 执 
行 脚 本 。 我 们 还 介绍 了 如 何 使 用 各 种 格式 技术 来 提升 脚本 的 可 读 性 〈 以 及 可 维 
护 性 )。 在 随后 的 章节 中 ， 易 于 维护 将 作为 编写 良好 脚本 的 核心 原则 多 次 出 现 。 
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局 动 一 个 项 目 


从 本 章 开 始 ， 我 们 将 开始 构建 一 个 程序 。 该 项 目的 目的 是 查看 如 何 使 用 各 
种 shell 特性 来 创建 程序 ， 而 且 更 为 重要 的 是 ， 如 何 创 建 好 的 程序 。 

我 们 将 要 编写 的 程序 是 一 个 报告 生成 器 ， 它 会 显示 系统 的 各 种 统计 数据 和 状 
态 。 并 以 HIML 格式 来 产生 该 报告 。 这 样 , 我 们 就 可 以 使 用 Web 浏览 器 进行 查看 。 

程序 一 般 由 一 系列 阶段 组 成 ， 每 一 个 阶段 都 会 增加 一 些 特性 和 功能 。 该 程 
序 的 第 一 个 阶段 是 创建 一 个 非常 小 的 HTML 页 面 ， 它 不 包含 任何 系统 信息 《后 
面 会 添加 这 些 信息 )。 


25.1 第 一 阶段 : 最 小 的 文档 
我 们 需要 知道 的 第 一 件 事 就 是 一 个 结构 良好 的 HTML 文档 的 格式 , 如 下 所 示 。 


<HTML> 
<HEAD> 
<TITLE>Page Title</TITLE> 
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</HEAD> 
<BODY> 
Page body. 
</BODY> 
</HTML> 


如 果 将 这 些 内 容 输入 到 文本 编辑 器 ， 并 将 该 文件 保存 为 foo.html, 就 可 以 在 
火狐 浏览 器 中 输入 “file://home/username/foo.html” 这 个 URL 地 址 查看 该 文件 。 

程序 的 第 一 个 阶段 是 将 这 个 HTML 文件 输出 到 标准 输出 。 我 们 可 以 编写 一 
个 程序 ， 来 很 容易 地 完成 该 任务 。 启 动 文本 编辑 器 ， 然 后 创建 一 个 名 为 
“~/bin/sys_info_page” 的 新 文件 。 


[me@linuxbox ~]$ vim ~/bin/sys_info._page 
随后 输入 以 下 的 程序 。 


#!1/bin/bash 
# Program to output a system information page 


echo "<HTML>" 

echo " <HEAD>" 

echo " <TITLE>Page Title</TITLE>" 
echo " </HEAD>" 

echo ” <BODY>" 

echo " Page body." 

echo " </B0ODY>" 

echo "</HTML>" 


我 们 第 一 次 要 尝试 解决 的 这 个 程序 包含 了 一 个 “shebang” 一 条 “注释 ”( 总 
是 一 个 比较 好 的 习惯 ) 和 一 系列 echo 命令 每 一 个 echo 命令 用 来 显示 一 行 。 保 
存 该 文件 之 后 ， 就 其 成 为 可 执行 文件 ， 并 尝试 去 运行 它 。 


[me@linuxbox ~]1$ chmod 755 ~/bin/sys_info_page 
[me@linuxbox ~]$ sys_info page 


该 程序 在 运行 时 ， 我 们 就 可 以 看 到 这 个 HTML 文档 的 文本 显示 在 屏幕 上 ， 
这 是 因为 脚本 中 的 echo 命令 将 其 输出 发 送 到 了 标准 输出 。 再 一 次 运行 该 程序 ， 
并 且 将 该 程序 的 输出 重新 定向 到 sys_info_page.html 文件 , 这 样 就 可 以 用 Web 浏 
览 器 查看 结果 了 。 


[me@linuxbox ~]$ sys_info_page > sys_info page.html 
[me@linuxbox ~]$ firefox sys_ info page.html 


目前 为 止 ， 一切 顺利 。 


在 编写 程序 时 ， 最 好 尽力 保持 程序 的 清晰 明了 。 当 一 个 程序 利于 阅读 和 理 
解 时 ， 维 护 起 来 也 会 很 容易 ， 而 且 通 过 减少 输入 量 ， 也 会 程序 更 容易 编写 。 该 
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程序 的 当前 版 本 虽然 工作 良好 ， 但 是 可 以 更 简洁 一 些 。 实 际 上 ， 我 们 可 以 将 所 
有 的 echo 命令 整合 为 一 个 命令 ， 这 样 就 可 以 更 容易 地 将 更 多 的 行 添加 到 程序 的 
输出 中 。 现 在 ， 将 程序 修改 为 如 下 所 示 : 


#1 /bin/bash 
# Program to output a system information page 


echo “<HTML> 
<HEAD> 
<TITLE>Page Title</TITLE> 
</HEAD> 
<BODY> 
Page body. 
</BODY> 
</HTHL>" 


一 个 带 引号 的 字符 串 可 以 包含 换行 符 , 因此 也 就 可 以 包含 多 个 文本 行 。shell 
将 持续 读 取 文 本 ， 直 到 读 取 到 下 一 个 引号 为 止 。 它 在 命令 行 中 也 是 这 样 工作 的 : 


[me@linuxbox ~]$ echo “<HTML> 


> 

> <TITLE>Page Title</TITLE> 
> </HEAD> 

> <BODY> 

> Page body. 

> </BODY> 

> </HTML>* 


每 行 开 头 的 “)” 字 符 是 包含 在 PS2 shell 变量 中 的 shell 提示 符 。 每 当 我 们 
在 shell 中 输入 多 行 语句 时 就 会 出 现 。 现 在 来 看 ， 这 个 功能 现在 还 不 是 很 明显 ， 
但 当 我 们 介绍 多 行 编程 语句 时 ， 它 会 相当 方便 。 


25.2 ”第 二 阶段 : 加 入 一 点 数据 


现在 该 程序 可 以 生成 一 个 最 小 的 文档 ， 我 们 在 这 个 文档 中 加 入 一 些 数据 。 
为 了 实现 这 个 目标 ， 需 要 做 以 下 改动 。 
#1 /bin/bash 
# Program to output a system information page 


echo "<HTML> 
<HEAD> 
<TITLE>System Information Report</TITLE> 
</HEAD> 
<BODY> 
<H1i>System Information Report</Ht> 
</BODY> 
</HTML>" 
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我 们 加 入 了 一 个 页 面 标 题 ， 并 为 报告 正文 部 分 添加 了 一 个 标题 。 


25.3 ”变量 和 常量 


但 是 ， 脚 本 现在 还 有 一 个 问题 。 请 注意 字符 串 “System Information Report” 
是 如 何 被 重复 的 。 对 于 我 们 这 个 小 脚本 来 说 ， 这 不 是 问题 。 但 是 ， 如 果 我 们 的 脚 
本 很 长 ， 而 且 多 处 都 存在 该 字符 串 ， 现 在 我 们 想 将 标题 修改 为 其 他 内 容 ， 则 需要 
在 多 个 地 方 进 行 修 改 ， 这 样 工作 量 就 大 了 。 我们 是 否 可 以 修改 脚本 ， 使 得 字符 串 
只 出 现 一 次 而 不 是 多 次 呢 ? 而 且 这 也 会 让 脚本 在 日 后 的 维护 更 加 简单 。 为 此 ， 
可 以 这 样 做 ; 


#!/bin/bash 


# Program to output a system information page 
title="Systenm Information Report" 


echo “<HTML> 
<HEAD> 
<TITLE>$title</TITLE> 
</HEAD> 
<BODY> 
<H1>$title</H1> 
</BODY> 
</HTNML>" 


通过 创建 一 个 叫 名 为 tile 的 变量 ， 并 且 将 其 赋值 为 “System Information 
Report”， 就 可 以 利用 参数 扩展 能 ， 将 该 字符 串 放 置 到 多 个 地 方 了 。 


25.3.1 创建 变量 和 常量 


如 何 创 建 变量 昵 ? 这 很 简单 ， 我 们 刚刚 使 用 过 。 当 shell 遇 到 一 个 变量 时 ， 
会 自动 创建 这 个 变量 。 这 点 与 大 多 数 程序 中 ， 使 用 一 个 变量 时 必须 先 声明 或 定 
义 有 所 不 同 。 在 这 个 方面 ，shell 非常 的 宽松 ， 但 也 会 导致 一 些 问 题 。 例 如 ， 请 
看 以 下 命令 行 中 出 现 的 场景 。 
[meelinuxbox ~]$ fo00="yes* 
[meelinuxbox ~]$ echo $foo 
yes 


{me@linuxbox ~]$ echo $fool 
[me@linuxbox ~]$ 


首先 我 们 为 变量 foo 赋值 yes， 再 使 用 echo 命令 显示 foo 的 值 。 然 后 我 们 显 
示 一 个 由 拼写 错误 造成 的 变量 fool 的 值 ， 而 得 到 了 一 个 空 值 。 这 是 因为 shell 在 


第 25 章 启动 一 个 项 目 315 


遇 到 fool 变量 时 ， 会 轻松 地 创建 这 个 变量 ， 并 且 为 这 个 fool 变量 赋 了 一 个 默认 
的 空 值 。 从 这 点 可 以 看 出 ， 我 们 必须 对 拼写 有 足够 的 关注 。 同 进 ， 也 要 理解 在 
这 个 示例 中 ， 究 竟 发 生 了 什么 。 我 们 前 面 学 到 ，shell 会 执行 扩展 ， 所 以 命令 


[me@linuxbox -j$ echo $foo 

会 经 历 参 数 扩展 ， 而 且 结果 是 : 

ne@linuxbox -]$ echoyes 
然而 命令 

[meelinuxbox -~]$ echo $fool 

则 扩展 为 


[me@linuxbox ~]$ echo 


这 个 为 空 的 变量 在 扩展 后 为 空 。 这 对 需要 使 用 参数 的 命令 说 来 ， 将 会 引起 
混乱 。 例 如 ; 
[meelinuxbox ~]$ foo=foo.txt 
[meelinuxbox ~]$ Too1=foo1.tXxt 
[me@linuxbox ~]$ cp $foo $fool 


cp: missing destination file operand after 'foo.txt' 
Try 'cp --heip' for more information. 


我 们 为 变量 foo 和 fool 赋值 , 然后 执行 cp 命令 , 但 将 第 二 个 参数 名 拼 错 了 。 
在 参数 扩展 后 ， 这 个 cp 命令 仅 接受 了 一 个 参数 ， 但 是 它 需 要 的 是 两 个 。 

变量 的 命名 规则 如 下 所 示 。 
。 变量 名 称 应 由 字母 、 数 字 和 下 划 线 组 成 。 
。 变量 名 称 的 第 一 个 字符 必须 是 字母 或 者 下 划 线 。 
。 变量 名 称 中 不 允许 空格 和 标点 。 

变量 意味 着 值 会 发 生变 化 ， 并 且 在 大 多 数 应 用 中 ， 变 量 就 是 这 样 使 用 的 。 在 
前 面 的 应 用 中 ， 变 量 title 其 实 是 作为 常量 使 用 的 。 常 量 其 实 就 是 一 个 有 名 称 和 确 
定 值 的 变量 。 区 别 就 是 , 常量 的 值 不 会 发 生变 化 。 在 一 个 执行 几何 计算 的 应 用 中 ， 
我 们 可 以 定义 PI 为 一 个 常量 , 并 且 将 它 的 值 赋 为 3.1415， 从 而 无 需 在 程序 中 使 用 
数值 3.1415。 对 于 shell 来 说 ,变量 和 常量 没有 区 别 ， 这 种 划分 更 多 的 是 为 了 编程 


者 的 方便 。 较 为 普遍 的 约定 是 ， 我 们 使 用 大 写字 母 表示 常量 ， 使 用 小 写字 母 表 示 
变量 。 我 们 将 前 面 的 shell 按照 这 个 约定 进行 修改 。 
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0 
#1/bin/bash 


# Program to output a system information page 
TITLE="System Information Report For S$HOSTNAME” 


echo "<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
</BODY> 
</HTML>" 


利用 这 个 机 会 , 我们 为 shell 中 的 变量 HOSTNAME 赋值 。 这 个 HOSTNAME 
是 机 器 在 网 络 上 的 名 称 。 


实际 上 ，shell 还 提供 了 强制 常量 不 发 生变 化 的 方法 ， 这 是 通过 使 用 带 有 -If 


选项 (只 读 ) 的 delcare 内 置 命令 实现 的 ,我 们 在 这 里 使 用 这 种 方式 为 变量 TITLE 
赋值 : | 
declare —r TITLE= “Page Title” 
shell 将 阻止 一 切 后 续 的 向 TITLE 的 赋值 。 这 个 特性 很 少 使 用 ， 但 在 很 早 的 
脚本 中 曾经 存在 。 


25.3.2 ”为 变量 和 常量 赋值 


这 是 我 们 开始 真正 使 用 扩展 的 地 方 。 我 们 已 经 看 到 ， 变 量 用 以 下 方式 来 赋值: 
variable=value 

其 中 ，variable 是 变量 的 名 称 ，value 是 变量 的 值 。 和 大 多 数 的 编程 语言 不 
同 ，shell 并 不 关心 赋 给 变量 的 值 数值 类 型 ， 它 会 将 其 都 当成 字符 串 。 通 过 使 用 
带 -i 选项 的 declare 命令 ， 可 以 强制 shell 将 变量 限制 为 整 型 数值 。 但 是 ， 这 如 同 
将 变量 设置 成 只 读 模 式 一 样 ， 我 们 很 少 这 样 做 。 

注意 ， 在 赋值 时 ， 变 量 名 、 等 号 和 值 之 间 不 能 含有 空格 。 那 么 ， 变 量 的 值 
中 可 以 包括 什么 呢 ? 它 包含 的 是 可 以 扩展 为 字符 串 的 任意 值 ; 


a=z # 将 字符 串 “z ”赋值 给 变量 a 

b=“a string” ## 嵌 入 的 空格 必须 用 引号 括 起 来 

c= “a String and $b” # 可 以 被 扩展 到 赋值 语句 中 的 其 他 扩展 ， 比 如 变量 
d=$(1s-1 foo.txt) # 命 令 的 结果 

e=$((5*7)) # 算 术 扩展 


f=“\t\ta string\n” # 转 义 序列 ， 比 如 制 表 符 和 换行 符 
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可 以 在 一 行 中 给 多 个 变量 赋值 。 
a=5 b="a string" 

在 扩展 期 间 ， 变 量 名 称 可 以 用 花 括号 “{}” 括 起 来 。 当 变量 名 因为 周围 的 
上 下 文 而 变 得 不 明确 时 ， 这 就 会 很 有 帮助 了 。 在 这 里 ， 我 们 使 用 变量 将 一 个 文 
件 的 名 字 由 myfile 改 为 myfilel: 


[me@linuxbox ~]$ filename="nyfile" 

[me@linuxbox ~]$ touch $filename 

[me@linuxbox ~]$ mv $filename $filenamel 

mv: missing destination file operand after 'myfile’ 
Try 'mv --help' for more information. 


因为 shell 将 mv 命令 的 第 二 个 参数 当成 了 一 个 新 的 变量 ， 所 以 这 样 做 没有 
成 功 。 该 问题 可 以 用 以 下 方法 解决 。 


[me@linuxbox ~]$ mv $filename ${filename}1 


用 花 括 号 括 起 来 后 ，shell 将 不 会 把 跟 在 后 面 的 “1” 认 为 是 变量 名 称 的 一 


部 分 。 
我 们 现在 添加 一 些 数据 到 我 们 的 报告 中 ， 比 如 报告 创建 的 日 期 、 时 间 ， 以 
及 报告 创建 者 的 用 户 名 。 


#1 /bin/bash 
# Program to output a system information page 


TITLE="*System Information Report For $HOSTNAME" 
CURRENT_TIME=$ (date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT_TIME, by S$USER" 


echo "<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
</BODY> 
</HTNL>" 


25.4 ”here 文档 


我 们 已 经 了 解 了 两 种 通过 echo 命令 输出 文本 的 不 同方 法 。 此 外 还 有 称 之 为 
“hure 文档 ”或 “here 脚本 ”的 第 三 种 方法 来 输出 文本 。here 文档 是 IO 重 定向 
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的 另外 一 种 形式 ,我 们 在 脚本 中 嵌入 正文 文本 ， 然 后 将 其 输入 到 一 个 命令 的 标准 
输入 中 。 工 作 方 式 如 下 : 


command << token 
text 
token 


其 中 ,command 是 接受 标准 输入 的 命令 名 , token 是 用 来 指示 嵌入 文本 结尾 
的 字符 串 。 现 在 修改 脚本 ， 使 其 使 用 here 文档 。 


#!1/bin/bash 
# Program to output a system information page 


TITLE="System Information Report For $HOSTNAME" 
CURRENT_TIME=$ (date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT TINME, by $USER" 


cat << _EOF_ 
<HTML> 2 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
</BODY> 
</HTML> 
_EOF_ 


我 们 的 脚本 不 再 使 用 echo， 而 是 使 用 cat 和 here 文档 。 字 符 串 _EOF_”( 含 
义 是 “文件 结尾 ”) 被 选 作 token， 并 且 指 示 骨 入 文本 的 结尾 。 注 意 ，token 必须 
在 一 行 中 单独 出 现 ， 而 且 文本 行 的 末尾 没有 空格 。 


那么 使 用 here 文档 有 什么 好 处 昵 ? 它 和 echo 命令 很 类 似 , 但 是 在 默认 情况 
下 ，here 文档 内 的 单 引 号 和 双 引 号 将 失去 它们 在 在 shell 中 的 特殊 含义 。 下 面 是 
一 个 命令 行 示例 。 


[me@linuxbox -]$ foo0="some text" 
[me@linuxbox ~]$ cat << EOF_ 
> $foo . 

> "$f0o0" 

> '$foo' 

> \$foo 

> _EOF_ 

some text 

"some text" 

‘some text' 

$foo 


可 以 看 到 ，shell 没有 注意 到 引号 ， 而 是 将 引号 当做 普通 字符 。 这 就 可 以 在 
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here 文档 中 随意 嵌入 引号 。 这 给 我 们 的 报告 程序 带 来 了 方便 。 


here 文档 可 以 和 能 够 接受 标准 输入 的 任何 命令 一 起 使 用 。 在 本 例 中 ， 我 们 使 
用 here 文档 向 ftp 程序 传递 一 系列 命令 ， 以 从 远程 FTP 服务 器 上 获取 一 个 文件 。 


#1/bin/bash 


# Script to retrieve a file via FTP | 


FTP_SERVER=ftp.nl.debian.org 
FTP_PATH=/debian/dists/lenny/main/installer-i386/current/images/cdrom 
REMOTE_FILE=debian-cd_info.tar.gz 


ftp -n << _EOF_ 

open $FTP_SERVER 

user anonymous me@linuxbox 
cd $FTP_PATH 


ash 
get $REMOTE_FILE 
bye 


_EOF_ 
1s -1 $REMOTE_FILE 


如 果 将 重 定向 操作 符 由 “<<” 改 为 “<<-”，shell 就 会 忽略 在 here 文档 中 开 
图 的 Tab 字符 。 这 样 就 能 缩 进 here 文档 ， 从 而 提供 可 读 性 。 


#!1/bin/bash 
# Script to retrieve a file via FTP 


FTP_SERVER=ftp.nl.debian.org 
FTP_PATH=/debian/dists/lenny/main/installer-i386/current/images/cdrom 
REMOTE_FILE=debian-cd_info.tar.gz 


ftp -n <<- _EOF_ 
open $FTP_SERVER 
user anonymous me@linuxbox 
cd $FTP_PATH 
hash 
get $REMOTE FILE 
bye 


_EOF_ 
1S -1 $REMOTE FILE 


25.5 本章 结 尾 语 


在 本 章 ， 我 们 启动 了 一 个 项 目 ， 该 项 目 带领 我 们 经 历 了 构建 一 个 成 功 脚本 的 
整个 过 程 。 我 们 还 介绍 了 变量 和 常量 的 概念 ， 以 及 使 用 它们 的 方式 。 它 们 是 第 一 
批 使 用 参数 扩展 的 应 用 程序 。 我 们 还 查看 了 如 何 从 脚本 中 产生 输出 ， 以 及 骨 入 文 
本 块 的 各 种 方法 。 


4 


自 项 向 下 设计 


” 随 着 程序 越 来 越 大 ， 越 来 越 复杂 ， 设 计 、 编 码 和 维护 都 将 越 来 越 困 难 。 所 
以 ， 在 设计 任何 大 型 项 目 时 ， 我 们 最 好 将 庞大 的 、 复 杂 的 任务 ， 拆 分 成 一 系列 
小 的 、 简 单 的 任务 。 


想象 一 下 ， 我 们 来 描述 一 个 常见 的 日 常任 : 一 个 火星 人 去 市 场 买 食物 。 我 
们 可 以 按照 如 下 步骤 来 描述 整个 过 程 。 


1. 上 和 车。 
. 开 往 市 场 。 
停车 。 
. 进入 市 场 。 
， 购 买 食物 。 
. 回 到 车 里 。 


QO nn 上 wb 
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7. 
8. 
9. 


开车 回 家 。 
停车 。 
进 屋 。 


但 是 ， 这 个 火星 人 需要 更 多 细节 。 我 们 可 以 将 子 任务 “停车 ”进一步 拆 分 
为 一 系列 步骤 。 


1 . 
. 将 车 开 入 停车 位 置 。 
.关闭 发 动机 。 
.拉手 刹 。 

. 下 车 。 

6. 


un BB WW Dh 


找 停车 的 位 置 。 


锁 上 车 门 。 


“关闭 发 动机 ” 子 任务 又 可 以 进一步 的 分 解 成 包括 “熄火 ”和 “ 拔 出 点 火 钥匙 ” 
等 步骤 。 这 样 逐 步 分 解 ， 直 到 全 部 定义 了 “去 市 场 ”这 个 过 程 的 整个 步骤 。 


这 种 先 确定 上 层 步 又， 然后 再 逐步 细 化 这 些 步骤 的 过 程 ， 称 为 自 顶 向 下 设计 。 


通过 这 种 设计 方式 , 可 以 将 大 而 复杂 的 任务 分 解 成 很 多 小 而 简单 的 任务 。 自 项 
向 下 设计 是 一 种 设计 程序 的 常见 方式 ， 尤 其 适合 shell 编程 。 


本 章 我 们 将 会 使 用 自 项 向 下 设计 方式 , 进一步 开发 我 们 的 报告 生成 器 脚本 。 


26.1 ”shell 前 数 


我 们 的 报告 当前 执行 如 下 步骤 ， 即 可 生成 HTML 文档 。 


1. 
. 打开 页 面 标题 。 
. 设置 页 面 标题 。 
. 关闭 页 面 标题 。 
.打开 页 面 主体 。 
.输出 页 面 主体 。 


OQ mW Dh 


打开 页 面 。 
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7. 输出 时 间 稚 。 
8. 关闭 页 面 主题 。 
9. 关闭 页 面 。 


为 了 下 一 阶段 的 开发 ， 我 们 将 在 步骤 7 和 步骤 8 之 间 额 外 添加 一 些 任务 ， 
如 下 所 示 。 


。 系统 正常 运行 时 间 和 负载 。 这 是 自 上 次 关机 或 重启 之 后 系统 的 运行 时 间 ， 
在 几 个 时 间 间 隔 内 ， 当 前 运行 在 处 理 器 上 的 平均 任务 量 。 


。 磁盘 空间 。 系 统 存储 空间 的 使 用 情况 。 
。 用 户 空间 。 每 个 用 户 所 使 用 的 存储 空间 。 


在 这 些 任务 中 ， 如 果 每 个 任务 都 有 一 条 对 应 的 命令 ， 我 们 可 以 直接 通过 命 
令 替 换 的 方式 ， 将 它们 添加 到 脚本 中 。 


#1/bin/bash 
# Program to output a System information page 
TITLE="System Information Report For $HOSTNAME” 


CURRENT_TIME=$ (date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT_TIME, by $USER" 


cat << _EOF_ 
<HTNL> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
$(report_ uptime) 
${(report disk space) 
$(report_home_space) 
</BODY> 
</HTNL> 
_EOF_ 


我 们 可 以 通过 两 种 方式 创建 这 些 额 外 的 命令 。 我 们 可 以 编写 3 个 独立 的 脚本 ， 并 
把 它们 放置 到 环境 变量 PATH 所 列 出 的 目录 中 ， 或 者 是 我 们 可 以 将 脚本 作为 shell 函 
数 嵌 入 到 程序 中 。 前 面 提 到 ，shell 函数 是 位 于 其 他 脚本 中 的 迷你 脚本 ， 可 以 用 作 自 主 
程序 (autonomous program )。shell 函数 有 两 种 语法 形式 。 第 一 种 如 下 所 示 : 


function name { 
commands 
return 

} 
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其 中 name 是 指 这 个 函数 的 名 称 ，commandqs 是 这 个 函数 中 的 一 系列 命令 。 
第 二 种 看 起 来 如 下 所 示 : 


name () { 
commands 
return 

} 


这 两 种 格式 等 价 ， 并 且 可 以 交替 使 用 。 来 看 下 面 这 个 脚本 ， 它 演示 了 shell 
函数 的 使 用 。 
#1/bin/bash 
# Shell function demo 
function funct { 


echo "Step 2" 
return 


ODNONPODN= 


} 
10 # Main program starts here 
12 echo "Step 1°" 


13 funct 
14 echo "Step 3" 


当 shell 读 取 脚本 的 时 候 ， 它 会 跳 过 第 1 一 11 行 ， 这 些 行 包含 的 是 注释 和 函数 
的 定义 。 执 行 从 带 有 echo 命令 的 第 12 行 开 始 。 第 13 行 调用 了 shell 函数 funct， 
shell 会 执行 这 个 函数 ， 而 且 其 执行 方式 与 执行 其 他 命令 时 相同 。 程 序 控制 权 然后 
移动 到 第 6 行 ， 执 行 第 2 个 echo 命令 ， 随 后 再 执行 第 7 行 。 这 个 return 命令 终止 
函数 的 执行 ， 然 后 将 控制 权 还 给 函数 调用 后 面 的 代码 (第 14 行 )， 然 后 执行 最 后 
一 个 echo 命令 。 注意 ,为 了 让 函数 调用 被 识别 为 shell 函数 ， 而 不 是 被 解释 为 外 部 
程序 的 名 字 ，shell 函数 的 定义 义 在 脚本 中 的 位 置 必 须 在 它 被 调用 的 前 面 。 

我 们 在 脚本 中 添加 上 最 小 的 shell 函数 定义 : 
#1 /bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME"* 
CURRENT _TINME=$ (date +"%x %r %2Z") 


TIME_STAMP="Generated $CURRENT TIME, by $USER" 


report _ uptime () { 
return 


} 
report _ disk space () { 
return 


report_ home_space () { 
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return 
} 
cat << EOF_ 
<HTML> 
<HEAD> 
<TITLE>$TITLE< /TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
$(report_uptime) 
$(report_disk_ space) 
$(report_home_space) 
</BODY> 
</HTNL> 
_EOF_ 


shell 函数 的 命名 规则 和 变量 相同 。 一 个 函数 必须 至 少 包含 一 条 命令 。retur 
命令 〈 可 选 的 ) 可 以 满足 该 要 求 。 


26.2 局 部 变量 


在 目前 我 们 所 编写 的 脚本 中 ， 所 有 的 变量 (包括 常量 都 是 全 局 变量 。 全 
局 变量 在 整个 程序 期 间 会 一 直 存在 。 在 很 多 情况 下 ， 这 都 不 错 。 但 是 有 时 候 ， 它 
会 让 shell 函数 的 使 用 变 得 复杂 。 在 shell 函数 中 ， 经 常 需要 的 是 局 部 变量 。 局 部 
变量 仅仅 在 定义 它们 的 shell 函数 中 有 效 ， 一 旦 shell 函数 终止 , 它们 就 不 再 存在 。 

局 部 变量 可 以 让 程序 员 使 用 已 经 存在 的 变量 名 称 ， 无 论 是 脚本 中 的 全 局 变量 ， 
还 是 其 他 shell 函数 中 的 变量 ， 而 不 用 考虑 潜在 的 命名 冲突 。 

下 面 是 一 个 显示 如 何 定义 和 使 用 局 部 变量 的 脚本 示例 。 
#!/bin/bash 
# local-vars: script to demonstrate local variables 
foo=0 # giobal variable foo 
funct 1 () { 

local foo # variable foo local to funct 1 


foo=1 
echo "funct 1: foo = $f00" 


} 
funct 2 () { 
local foo # variable foo local to funct 2 


foo=2 
echo "funct 2: foo = $foo" 
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echo "global: foo = $foo" 
funct_1 
echo "global: foo = $foo" 
funct 2 
echo "global: foo = $f00" 


可 以 看 到 ， 局 部 变量 是 通过 在 变量 名 前 面 添 加 单词 local 来 定义 的 。 这 样 ， 
就 创建 并 同时 定义 了 一 个 shell 函数 中 的 局 部 变量 。 一 旦 出 了 这 个 shell 函数 ， 这 
个 局 部 变量 将 不 再 存在 。 当 运行 该 脚本 时 ， 结 果 如 下 所 示 : 

[me@linuxbox ~]$ local-vars 
global: foo = 0 
funct _ 1: foo = 1 
global: foo = 0 


funct 2: foo = 2 
global: foo = 0 


可 以 看 到 , 在 两 个 shell 函数 中 对 局 部 变量 foo 的 赋值 , 不 影响 shell 函数 以 
外 定义 的 变量 foo 的 值 。 


这 个 特性 可 以 让 我 们 编写 的 shell 函数 相互 独立 , 而 且 也 独立 于 它们 所 在 的 脚 
本 。 这 非常 有 用 ， 因 为 它 有 助 于 阻止 程序 中 各 个 部 分 的 相互 干扰 。 该 特性 也 可 
以 让 我 们 编写 出 可 移植 的 shell 函数 。 也 就 是 说 ， 我 们 可 以 根据 需要 将 某 一 个 脚 
本 中 的 shell 函数 剪 切 下 来 ， 然 后 粘贴 到 另外 一 个 脚本 中 。 


26.3 ”保持 脚本 的 运行 


在 开发 程序 时 ， 让 程序 保持 可 运行 的 状态 会 非常 有 用 。 通 过 这 种 方式 ， 并 
经 常 测试 ， 就 可 以 在 开发 过 程 的 早期 检测 到 错误 。 这 也 会 让 问题 的 调试 变 得 容 
易 。 例 如 ， 如 果 我 们 运行 某 个 程序 ， 并 对 它 做 了 细微 改动 ， 然 后 再 次 运行 该 程 
序 ， 此 时 发 现 了 问题 。 这 可 能 有 可 能 是 最 近 的 改动 导致 的 。 通 过 添加 空 函 数 ( 程 
序 员 将 其 称 为 stub), 我 们 可 以 在 早期 验证 程序 的 逻辑 流程 。 当 构建 一 个 stub 时 ， 
最 好 是 包含 一 些 能 够 为 程序 员 提 供 反馈 信息 的 东西 ， 这 些 反馈 信息 可 以 显示 正 
在 执行 的 逻辑 流程 。 如 果 现 在 查看 脚本 的 输出 ， 会 发 现在 时 间 惟 之 后 的 输出 中 
有 一 些 空 行 ， 但 是 我 们 不 确定 是 什么 原因 导致 的 。 

[meelinuxbox ~]$ sys_info_page 
<HTML> 
<HEAD> 
<TITLE>System Information Report For twin2</TITLE> 
</HEAD> 


<BODY> 
<Hi>System Information Report For linuxbox</H1> 
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<P>Generated 03/19/2012 04:02:10 PM EDT, by we</P> 


</BODY> 
</HTML> 


我 们 修改 该 函数 ， 使 其 包含 一 些 反馈 信息 。 


report _ uptime () { 
echo "Function report_uptime executed." 
return 


} 


report disk space () { 
echo "Function report disk space executed." 
return 


} 


report_home space () { 
echo “Function report home space executed." 
return 


然后 再 次 运行 该 脚本 。 


[me@linuxbox ~]$ sys_info page 
<HTML> 
<HEAD> 


<TITLE>System Information Report For linuxbox</TITLE> 

</HEAD> 

<BODY> 
<H1>System Information Report For linuxbox</H1> 
<P>Generated 03/20/2012 05:17:26 AM EDT，by me</P> 
Function report_uptime executed. 
Function report disk_space executed. 
Function report home space executed. 

</BODY> 

</HTML> 


这 次 可 以 发 现 ， 我 们 的 三 个 函数 事实 上 都 执行 了 。 


由 于 我 们 的 函数 框架 没有 问题 ， 因 此 ， 需 要 更 新 一 些 函 数 代码 。 首 先是 
report_uptime 函数 。 


report_uptime () { 
cat <<- _EOF_ 
<H2>System Uptime</H2> 
<PRE>$(uptime)</PRE> 
EOF_ 
return 


该 函数 的 代码 直截了当 。 我们 使 用 了 一 个 here 文档 来 输出 一 个 标题 ， 并 输出 
uptime 命令 的 结果 。 命 令 结果 使 用 <PRE> 标 签 围 起 来 ， 其 目的 是 保留 命令 的 格式 。 
report_disk_space 函数 也 类 似 。 
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report disk _ space () { 
cat <<- _EOF_ 
<H2>Disk Space Utilization</H2> 
<PRE>$(df -h)</PRE> 
_EOF_ 
return 


这 个 函数 使 用 了 df-h 命令 来 检查 磁 得 的 空间 。 随 后 ， 我 们 来 构建 report_ 
home_space 函数 。 
report_home_space () { 
at <<- _EOF_ 
<H2>Home Space Utilization<c/H2> 
<PRE>$(du -sh /home/*)</PRE> 
_EOF_ 
return 


我 们 使 用 带 -sh 选项 的 du 命令 来 执行 这 个 任务 。 这 个 并 不 是 问题 的 完整 解 
决 方案 。 昌 然 它 可 以 在 某 些 操作 系统 中 (例如 Ubuntu) 运行 ， 但 是 在 其 他 系统 
中 则 无 效 。 这 是 因为 很 多 系统 设置 了 主 目录 的 权限 ， 以 防止 被 其 他 用 户 读 取 ， 
这 种 安全 措施 也 很 合理 。 在 这 些 操作 系统 中 ， 只 有 在 超级 用 户 运行 我 们 的 脚本 
时 ， 我 们 编写 的 这 个 report_home_space 函数 才 会 执行 。 一 个 更 好 的 解决 方案 是 
让 脚本 根据 用 户 的 权限 调整 自己 的 行为 。 我 们 在 下 一 章 讨论 该 问题 。 


你 的 .bashrc 文件 中 的 shell 函数 
shell 函数 可 以 很 好 地 取代 别名 ， 并 且 实际 上 也 是 创建 个 人 使 用 的 小 命令 
的 首选 方法 。 别 名 非常 局 限于 命令 的 种 类 和 它们 支持 的 shell 特性 ， 而 shell 
特性 则 允许 任何 可 以 编写 为 脚本 的 东西 。 例 如 ， 如 果 我 们 很 喜欢 为 脚本 开发 
的 report_disk_space 这 个 shell 函数 ， 则 可 以 为 我 们 的 .bashre 文件 创建 一 个 相 
似 的 名 为 ds 的 函数 。 


ds () { 
echo “Disk Space Utilization For $HOSTNAME” 
f -h 


} 


26.4” ”本章 结尾 语 


在 本 章 , 我 们 介绍 了 一 种 常用 的 一 种 程序 方式 一 一 自 顶 向 下 设计 , 并 知道 了 如 
何 使 用 shell 函数 按照 要 求 来 构建 逐步 细 化 的 任务 。 我 们 还 学 习 了 如 何 使 用 局 部 变 
量 时 shell 函数 相互 独立 ， 并 独立 于 它们 所 在 的 程序 。 这 样 ， 我 们 就 可 以 以 可 移植 
和 可 重用 的 方式 编写 shell 函数 ， 并 将 其 用 到 多 个 程序 中 ， 从 而 节省 大 量 的 时 间 。 
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上 一 章 中 ， 我 们 提出 了 一 个 问题 。 如 何 使 我 们 的 报告 生成 器 脚本 能 适应 运 
行 该 脚本 的 用 户 的 权限 ? 该 问题 的 解决 方案 要 求 我 们 能 找到 一 种 方法 ， 在 脚本 
中 能 基于 测试 的 结果 来 “改变 方向 ”。 用 编程 术语 来 说 ， 就 是 我 们 需要 程序 能 够 
分 支 。 


让 我 们 来 考虑 一 个 使 用 伪 代 码 表 示 的 简单 逻辑 示例 。 伪 代码 是 计算 机 语言 
的 一 种 模拟 ， 为 的 是 方便 人 们 理解 。 
X = 5 
IfX=5，then'; 
Say "X equals 5.°" 


Otherwise: 
Say "X is not equal to 5.°" 


这 就 是 一 个 分 支 的 例子 。 根 据 条 件 ， 如 果 “X=5” 表示 为 “XX 等 于 5” 否 
则 ， 则 说 “X 不 等 于 5”。 
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27.1 使 用 并 
z 通过 shell， 我 们 可 以 对 上 面 的 逻辑 进行 编码 ， 如 下 所 示 : 


x=5 


if [ $x = 5 ]; then 

echo "x equals 5." 
else 

echo "x does not equal 5,." 
fi 


或 者 可 以 直接 在 命令 行 中 输入 以 上 代码 〈 略 有 简化 )。 


[me@linuxbox ~]$ x=5 ., 

[me@linuxbox ~]$ if [ $x = 5 ]; then echo "equals 5"; else echo "does not equal 
5"; fi 

equals 5 

[me@linuxbox ~]$ x=0 

[meelinuxbox ~]$ if [ $x = 5 ]; then echo "equals 5"; else echo "does not equal 
5"; 4 : : 

does not equal 5 


在 这 个 例子 中 ， 我 们 执行 了 两 次 命令 。 第 一 次 ， 设 置 变量 X 为 S， 从 而 输 
出 字符 串 “equals 5” 第 二 次 ， 设 置 变 量 X 为 0， 从 而 输出 字符 串 “does notequal 5”。 


让 语句 的 语法 格式 如 下 。 


if commands; then 

commands 
[elif commands; then 

commands...] 
[else 

commands] 
fi 

在 这 个 语法 格式 中 ,“command” 可 以 是 一 组 命令 。 乍 看 上 去 可 能 会 有 些 迷 

惑 。 在 去 除 这 个 迷惑 前 ， 我 们 必须 先 解 一 下 shell 如 何 判断 一 个 命令 的 成 功 与 失 


败 的 。 


27.2 退出 状态 


命令 (包括 我 们 编写 的 脚本 和 shell 函数 ) 在 执行 完毕 后 ,会 向 操作 系统 
发 送 一 个 值 ， 称 之 为 “退出 状态 ”。 这 个 值 是 一 个 0 一 255 的 整数 ， 用 来 指示 
命令 执行 成 功 还 是 失败 。 按 照 惯例 ， 数 值 0 表示 执行 成 功 ， 其 他 的 数值 表示 
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执行 失败 。shell 提供 了 一 个 可 以 用 来 检测 退出 状态 的 参数 。 在 下 面 的 例子 中 
可 以 看 到 。 
[meelinuxbox -]$ 1s -d /usr/bin 


/usrjbin 
[me@linuxbox ~]$ echo $7? 


0 

[me@linuxbox ~]$ ls -d /bin/usr 

1S: cannot access /bin/usr: No such file or directory 
[me@linuxbox ~]$ echo $? 

2 


在 这 个 例子 中 ， 我 们 两 次 执行 了 ls 命令 。 第 一 次 ， 命 令 执行 成 功 ， 如 果 显 
示 参 数 “$?” 的 值 ， 可 以 看 到 它 是 0。 第 二 次 执行 ls 命令 时 ， 产 生 了 一 个 错误 ， 
再 次 显示 参数 “$?” 的 值 ， 这 次 则 为 2， 表 示 这 个 命令 遇 到 了 一 个 错误 。 有 些 命 
令 使 用 不 同 的 退出 值 来 诊断 错误 ， 而 许多 命令 在 执行 失败 时 ， 只 是 简单 地 退出 
并 发 送 数 字 1。man 手册 中 经 常会 包括 一 个 标题 为 “Exit Status” 的 段落 ， 它 描述 
使 用 的 代码 。 数 字 0 总 是 表示 执行 成 功 。 


shell 提供 了 两 个 非常 简单 的 内 置 命令 ， 它 们 不 做 任何 事情 ， 除 了 以 一 个 
0 或 1 退出 状态 来 终止 执行 。“true” 命 令 总 是 表示 执行 成 功 ， 而 “false” 命 
令 总 是 表示 执行 失败 。 
[me@linuxbox ~-]$ true 
[me@linuxbox -]$ echo $7? 
0 


[me@linuxbox ~]$ false 
[me@linuxbox ~]$ echo $? 
1 


我 们 可 以 用 这 两 个 命令 来 查看 if 语句 是 如 何 工作 的 。if 语句 真正 做 的 事情 
是 评估 命令 的 成 功 或 失败 。 
[meelinuxbox -]$ if true; then echo "It's true."; fi 
It's true. 


[me@linuxbox ~]1$ if false; then echo "It's true."; fi 
[me@linuxbox ~]$ 


当 在 站 后 面 的 命令 执行 成 功 时 ， 命 令 echo ”It's true.” 会 被 执行 ， 而 当 在 让 
后 面 的 命令 执行 失败 时 ， 该 命令 则 不 执行 。 如 果 在 站 后 面 有 一 系列 的 命令 ， 那 
么 则 根据 最 后 一 个 命令 的 执行 结果 进行 评估 。 
[me@linuxbox ~]$ if false; true; then echo "It's true."; fi 
It's true. 


[meelinuxbox ~]$ if true; false; then echo "It's true."; fi 
[me@linuxbox ~]$ 
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27.3 ”使 用 test 命令 
目前 为 止 ， 


经 常 和 让 一 起 使 用 的 命令 是 test。test 命令 会 执行 各 种 检查 和 比 


较 。 这 个 命令 有 两 种 等 价 的 形式 : 


test expression 


以 及 更 流行 的 : 


[ expression ] 


这 里 expression 是 一 个 表达 式 ， 其 结果 是 true 或 false。 当 这 个 表达 式 为 true 
时 , test 命令 返回 一 个 零 退 出 状态 ; 当 表 达 式 为 false 时 , test 命令 的 退出 状态 为 1。 


27.3.1 ”文件 表达 式 


表 27-1 中 的 表达 式 用 来 评估 文件 的 状态 。 
表 27-1 测试 文件 的 表达 式 


表达 式 
filel -ef file2 
filel -nt file2 
filel —ot file2 
-b file 
-c file 
-d file 
-e file 
-ffile 
-gfile 
-G file 
-k file 
-Lfile 
-O file 
-p file 
-r file 
-s file 
-S file 


成 为 true 的 条 件 


filel 和 file2 拥有 相同 的 信息 节点 编号 “这 两 个 文件 通过 硬 链 接 指向 同一 个 文件 》 
filel 比 file 2 新 

filel 比 file2 有 旧 

file 存在 并 且 是 一 个 块 〈 设 备 ) 文件 

file 存在 并 且 是 一 个 字符 (设备 ) 文件 

file 存在 并 且 是 一 个 目录 

file 存在 

file 存在 并 且 是 一 个 普通 文件 

file 存在 并 且 设置 了 组 ID 

file 存在 并 且 属 于 有 效 组 ID 

file 存在 并 且 有 “ 粘 沾 位 (sticky bit)” 属 性 
file 存在 并 且 是 一 个 符号 链接 

file 存在 并 且 属 于 有 效用 户 ID 

file 存在 并 且 是 一 个 命名 管道 

file 存在 并 且 可 读 〈《 有 效用 户 有 可 读 权 限 ) 
file 存在 并 且 其 长 度 大 于 0 

file 存在 并 且 是 一 个 网 络 套 接 字 
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续 表 
表达 式 成 为 true 的 条 件 
-tfd fd 是 一 个 定向 到 终端 /从 终端 定向 的 文件 描述 符 ， 可 以 用 来 确定 标准 输入 /输出 /错误 
是 否 被 重 定向 
-ufile file 存在 并 且 设 置 了 setuid 位 
-w file file 存在 并 且 可 写 《 有 效用 户 拥 有 可 写 权限 》 
-x file fiile 存在 并 且 可 执行 (有效 用户 拥有 执行 /搜索 权限 ) 


下 面 的 脚本 可 用 来 演示 某 些 文件 表达 式 。 


#1! /bin/bash 
# test-file: Evaluate the status of a file 
FILE=~/ .bashrc 
if [ -e "$FILE" ]; then 
if [ -f "$FILE"* ]; then 


echo "$FILE is a regular file." 


if [ -d “$FILE" ]; then 
echo "$FILE is a directory." 


if [ -r "$FILE" ]; then 
echo "$FILE is readable." 


if [ -w "$FILE" ]; then 
echo "$FILE is writable." 


if [ -x "$FILE" ]; then 
echo "$FILE is executable/searchable." 


fi 

else 
echo “$FILE does not exist" 
exit 1 

fi 


exit 

这 个 脚本 会 评估 赋值 给 常量 FILE 的 文件 ， 并 显示 评估 结果 。 关 于 该 脚本 ， 
需要 注意 两 个 有 趣 的 地 方 。 首 先 ， 要 注意 $FILE 在 表达 式 内 是 怎样 被 引用 的 。 
尽管 引号 不 是 必需 的 ， 但 是 这 可 以 防范 参数 为 空 的 情况 。 如 果 $FILE 的 参数 扩 
展 产生 一 个 空 值 ， 将 导致 一 个 错误 〈 操 作 符 会 被 解释 为 非 空 的 字符 串 ， 而 不 是 
操作 符 )。 用 引号 把 参数 括 起 来 可 以 确保 操作 符 后 面 总 是 跟随 着 一 个 字符 串 ， 即 
使 字符 串 为 空 。 其 次 ， 注 意 脚本 末尾 的 exit 命令 。 这 个 exit 命令 接受 一 个 单独 
的 可 选 参数 ， 它 将 成 为 脚本 的 退出 状态 。 当 不 传递 参数 时 ， 退 出 状态 默认 为 0。 
以 这 种 方法 使 用 exit 命令 ， 当 $FILE 扩展 为 一 个 不 存在 的 文件 名 时 ， 可 以 允许 
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脚本 提示 失败 。 这 个 exit 命令 出 现在 脚本 的 最 后 一 行 。 这 样 ， 当 脚本 执行 到 最 
后 时 ， 不 管 怎样 ， 默 认 情况 下 它 将 以 退出 状态 零 终止 。 
类 似 地 ， 通 过 在 return 命令 中 包含 一 个 整数 参数 ，shell 函数 可 以 返回 一 个 
退出 状态 。 如 果 要 将 上 面 的 脚本 转换 为 一 个 shell 函数 ， 从 而 能 够 在 一 个 更 大 的 
程序 中 使 用 ， 可 以 将 exit 命令 替换 为 returmn 命令 ， 并 得 到 想 要 的 行为 。 


test _file () 1{ 


# test-file: Evaluate the status of a file 


FILE=~/ .bashrc 


if [ -e “$FILE® ]; then 
if [ -f "$FILE" ]; then 


fi 
if 


fi 
if 
fi 
if 
fi 
if 


fi 
else 


echo "$FILE is a regular file." 


"$FILE" ]; then 


echo “$FILE is a directory." 


"$FILE" ]; then 


echo “$FILE is readable." 


“$FILE" ]; then 


echo "$FILE is writable." 


“$FILE" ]; then 


echo "$FILE is executable/searchable." 


echo "$FILE does not exist" 


return 1 


27.3.2 ”字符 串 表达 式 


表 27-2 中 的 表达 式 用 来 测试 字符 串 的 操作 。 


表 27-2 测试 字符 囊 表 达 式 


表达 式 成 为 true 的 条 件 
string string 不 为 空 

-n string string 的 长 度 大 于 0 
-2 string string 的 长 度 等 于 0 


stringl=string2 
stringl==string2 


stringl 和 string2 相等 。 单 等 号 和 双 等 号 都 可 以 使 用 ， 但 是 双 等 号 使 用 的 更 多 


string1!=string2 stringl 和 string2 不 相等 
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续 表 
表达 式 成 为 true 的 条 件 
stringl>string2 ”在 排序 时 ，stringi 在 string2 之 后 
stringl<string2 在 排序 时 ，stringl 在 string2 之 前 


警告 在 使 用 test 命 令 时 ，“>” 和 “<” 运 算 符 必须 用 引号 括 起 来 (或 者 是 使 用 反 
斜 杠 进行 转 义 ) ”如果 不 这 样 做 ， 就 会 被 shell 解释 为 重 定向 操作 符 ， 从 而 造成 
潜在 的 破坏 性 结果 。 同 时 注意 ， 尽 管 bash 文档 中 已 经 声明 ， 排 序 遵 从 当前 语系 
的 排列 规则 ,但 并 非 如 此 ,在 bash 4.0 版 本 以 前 ( 包括 4.0 版 本 ) 使 用 的 是 ASCII 
(POSIX ) 排序 方式 。 


下 面 是 一 个 合并 字符 串 表 达 式 的 脚本 。 


#!1/bin/bash 
# test-string: evaluate the value of a string 
ANSWER=maybe 


if [ -z "$ANSWER" ]; then 
echo "There is no answer.” >&2 
exit 1 
fi 
if [ "$ANSWER" = "yes" ]; then 
echo "The answer is YES." 
elif [ "$ANSWER" = "no" ]; then 
echo "The answer is NO." 
elif [ "$ANSWER" = "maybe" ]; then 
echo "The answer is MAYBE." 
else 
echo "The answer is UNKNOWN . 
fi 


在 这 个 脚本 中 ， 我 们 评估 了 常量 ANSWER。 我 们 首先 检查 了 这 个 字符 串 是 
否 是 空 。 如 果 是 空 ， 则 终止 脚本 ， 并 且 把 退出 状态 设置 为 1。 注意 应 用 到 echo 命 
令 的 重 定向 操作 。 它 把 错误 消息 “There is no answer.” 重 定向 到 标准 错误 ， 这 也 
是 处 理 错误 信息 的 “合理 ”方法 。 如 果 字 符 串 非 空 ， 则 评估 这 个 字符 串 的 值 是 否 
是 “yes”、“no” 或 者 “maybe”。 我 们 使 用 elif (else if 的 缩写 ) 来 实现 上 述 目 的 。 
通过 使 用 elif， 我 们 可 以 建立 一 个 更 复杂 的 逻辑 测试 。 


27.3.3 ”整数 表达 式 
表 27-3 中 的 表达 式 用 于 整数 。 
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表 27-3 整数 判断 操作 


表达 式 成 为 true 的 条 件 

integerl -eq integer2 integerl 和 integer2 相等 
integerl -ne integer2 integerl 和 integer2 不 相等 
integer] -le integer2 integerl 小 于 等 于 integer2 
integerl -lt integer2 integerl 小 于 integer2 
integerl 一 ge integer2 integerl 大 于 等 于 integer2 
integerl —gt integer2 integerl 大 于 integer2 


下 面 是 一 个 演示 这 些 表达 式 的 脚本 。 
#1 /bin/bash 
# test-integer: evaluate the value of an integer. 
INT=-5 


if [ -z “$INT" ]; then 
echo “INT is empty." >&2 
exit 1 

fi 

if [ $INT -eq 0 ]; then 
echo "INT is zero." 


else 
if [ $INT -1t 0 ]; then 
echo "INT is negative." 
else 
echo “INT is positive." 
fi 
if [ $((INT % 2)) -eq 0 1]; then 
echo “INT is even." 
else 
echo “INT is odd." 
fi 
fi 


这 个 脚本 中 最 有 意思 的 地 方 是 ， 如 何 判断 一 个 整数 是 奇数 还 是 偶数 。 通 过 
用 模 数 2 对 数值 进行 求 模 运算 ， 也 就 是 将 这 个 数值 除 以 2 并 且 返 回 余数 ， 这 就 
可 以 知道 这 个 数值 是 奇数 还 是 偶数 了 。 


27.4 ”更 现代 的 test 命令 版 本 


bash 的 最 近 版 本 包括 了 一 个 符合 命令 ， 它 相当 于 增强 的 test 命令 。 下 面 是 
这 个 命令 的 语法 。 
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[ [expression ] ] 


expression 是 一 个 表达 式 ， 其 结果 为 ture 或 false。[ [ ] ] 命 令 和 test 命令 类 似 
《支持 所 有 的 表达 式 )， 不 过 增加 了 一 个 很 重要 的 新 字符 串 表 达 式 。 
string1= regex 

如 果 stringl 与 扩展 的 正则 表达 式 regex 匹配 ， 则 返回 true。 这 就 为 执行 数 
据 验 证 这 样 的 任务 提供 了 许多 可 能 性 。 在 前 面 整 数 表 达 式 的 例子 中 ， 如 果 常 量 
INT 含有 整数 以 外 的 其 他 值 ， 脚 本 就 会 执行 失败 。 脚 本 需要 有 一 种 方法 来 验证 
常量 包含 的 是 否 是 整数 。 可 以 使 用 [ [ ] ] 和 = 字符 串 表 达 式 操作 符 ， 按 照 如 下 方 
式 改 进 脚本 ， 
#1/bin/bash 
# test-integer2: evaluate the value of an integer. 
INT=-5 
if [[ "$INT" =~ “^-?[0-9]+$ ]]; then 


if { $INT -eq 0 ]; then 
echo "INT is zero." 


else 
if [ $INT -lt 0 ]; then 
echo "INT is negative." 
else 
echo "INT is positive." 
fi 
if [ $((INT % 2)) -eq 0 ]; then 
echo “INT is even.” 
else 
echo “INT is odd." 
fi 
fi 
else 
echo "INT is not an integer." >&2 
exit 1 
fi 


通过 应 用 正则 表达 式 ， 我 们 可 以 限制 INT 的 值 只 能 是 字符 串 ， 而 且 字 符 
串 必 须 以 以 减 号 《可 选 ) 开头 ， 后 面 跟着 一 个 或 者 多 个 数字 。 这 个 表达 式 同 
样 消除 了 INT 为 空 值 的 可 能 性 。 


[ [ ] ] 增 加 的 另外 一 个 特性 是 一 操作 符 支 持 模式 匹配 ， 就 像 路 径 名 扩展 那 
样 。 举 例如 下 。 


[meelinuxbox ~]$ FILE=foo.bar 

{me@linuxbox ~]$ if [[ $FILE == foo.* 1; then 
> echo "$FILE matches pattern 'fo0.*' 

> fi 

foo.bar matches pattern ‘foo.*' 
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这 使 得 [[] ] 在 评估 文件 和 路 径 名 的 时 候 非 常 有 用 。 


27.5 “〈()) 一 一 为 整数 设计 
除了 [[] ] 的 复合 命令 之 外 ，bash 同样 提供 了 (( ) ) 复 合 命令 , 它 可 用 于 操作 整 
数 。 该 命令 支持 一 套 完 整 的 算术 计算 ， 这 部 分 内 容 将 在 第 34 章 中 介绍 。 
(() ) 用 于 执行 算术 真 值 测试 〈arithmetic truth test)。 当 算术 计算 的 结果 是 
非 零 值 时 ， 则 算术 真 值 测试 为 true。 


[meelinuxbox ~]$ if ({(1)); then echo "It is true." fi 
It is true. 

[me@linuxbox ~]$ if ((0)); then echo "It is true."; fi 
[me@linuxbox ~]$ 


使 用 (())， 我 们 可 以 简化 test-integer2 脚本 ， 如 下 所 示 。 


(#1/bin/bash 


# test-integer2a: evaluate the value of an integer. 


INT=-5 
if [[ "$INT" =~ ~^-?[0-9]+$ ]]; then 
if ((INT == 0)); then 
echo "INT is zero.’ 
else 
if ((INT < 0)); then 
echo "INT is negative." 
else 
echo "INT is positive.”" 
fi 
if (( ((INT % 2)) == 0)); then 
echo "INT is even." 
else 
echo "INT is odd.”" 
fi 
fi 
else 
echo "INT is not an integer."” >&2 
exit 1 
fi 


注意 这 里 使 用 了 小 于 号 、 大 于 号 和 等 号 用 来 测试 相等 性 。 在 处 理 整 数 时 ， 
这 些 语 法 看 起 来 也 更 自然 。 另 外 ， 由 于 (() ) 复 合 命令 只 是 shell 语法 的 一 部 分 ， 
而 非 普 通 的 命令 ， 并 且 只 能 处 理 整 数 ， 所 以 它 能 够 通过 名 字 来 识别 变量 ， 而 且 
不 需要 执行 扩展 操作 。 


27.6 
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组 合 表达 式 


我 们 也 可 以 将 表达 式 组 合 起 来 ， 来 创建 更 复杂 的 计算 。 表 达 式 是 使 用 逻辑 
运算 符 组 合 起 来 的 。 在 第 17 章 , 我 们 在 学 习 find 命令 的 时 候 已 经 介绍 过 。 与 test 
和 [f]] 命 令 配 套 的 逻辑 运算 符 有 三 个 ， 它 们 是 AND、OR 和 NOT。 test 和 [[]] 
使 用 不 同 的 操作 符 来 表示 这 三 种 逻辑 操作 ， 如 表 27-4 所 示 。 


表 27-4 逻辑 操作 符 


Operation test [and(() 
AND -a && 

OR -0 | 

NOT ! ! 


下 面 是 一 个 AND 运算 的 例子 。 这 个 脚本 用 来 检测 一 个 整数 是 否 属于 某 个 范 
围 内 的 值 。 


#!/bin/bash 
# test-integer3: determine if an integer is within a 
# specified range of values. 


MIN_VAL=1 
MAX_VAL=100 


INT=50 
if [[ “$INT。 =-“^-?[0-9]+$ ]]; then 


if [[ INT -ge MIN VAL && INT -le MAX_VAL ]]; then 
echo "$INT is within SHIN_VAL to $MAX_VAL." 


else 
echo "$INT is out of range.”" 
fi 
else 
echo "INT is not an integer." >&2 
exit 1 
fi 


在 这 个 脚本 中 ， 检 测 整 数 INT 的 值 是 否 在 MIN_VAL 和 MAX_VAL 之 间 。 
这 是 通过 一 个 [ [ ] ] 运 算 符 来 执行 的 ， 该 运算 符 中 包含 两 个 用 “&&” 运 算 符 分 隔 
来 的 表达 式 。 当 然 我 们 也 可 以 使 用 test 完成 该 功能 。 
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if [ $INT -ge $MIN_VAL -a $INT -le $MAX_VAL ]; then 
echo "$INT is within S$MIN_VAL to $MAX_VAL." 
else 
echo "S$INT is out of range." 
fi 


“1»” 否 定 运 算 符 对 表达 式 的 运算 结果 取 反 。 如 果 表 达 式 为 lse， 则 返回 true; 
反之 ， 如 果 表 达 式 为 tue， 则 返回 false。 在 下 面 的 脚本 中 ， 我 们 将 修改 判断 逻 
辑 ， 以 判断 INT 的 值 是 否 在 指定 的 范围 之 外 : 


#1/bin/bash 


# test-integer4: determine if an integer is outside a 
# specified range of values. 


MIN_VAL=1 
MAX_VAL=100 
INT=50 
if [[ "$INT" =~“^-?[0-9]+$ ]]; then 
if [{ ! (INT -ge MIN VAL && INT -le MAX_VAL) 1]; then 
echo "S$INT is outside $MIN_VAL to $MAX_VAL." 
else 
echo "$INT is in range." 
fi 
else 
echo "INT is not an integer." >&2 
exit 1 
fi 


当然 我 们 也 可 以 使 用 圆 括号 把 表达 式 括 起 来 ， 以 进行 分 组 。 如 果 不 使 用 圆 
括号 ,“! ”运算 符 仅 对 第 一 个 表达 式 有 效 ， 而 不 是 对 两 个 组 合 后 的 表达 式 有 效 。 
用 test 命令 可 以 按照 如 下 进行 编码 : 
if [ ! \{( $INT -ge $MIN VAL -a $INT -le $MAX VAL \) ]; then 

echo "$INT is outside $MIN VAL to $MAX_VAL." 
else 


echo "$INT is in range." 
fi 


由 于 test 使 用 的 所 有 表达 式 和 操作 符 都 被 shell 看 做 命令 参数 不 像 [[] ] 以 
及 (() ))， 因此 在 bash 中 有 特殊 含义 的 字符 ， 如 “>? “(” 和 “)2， 必须 
用 引号 括 起 来 或 者 进行 转 义 。 


test 和 [ [ ] ] 命 令 基 本 上 完成 相同 的 功能 ， 那 么 ， 哪 一 个 更 好 呢 ? test 更 为 传 
统 〈 而 且 也 是 POSIX 的 一 部 分 )， 而 [ [ ] ] 则 是 bash 特定 的 。 由 于 test 命令 的 使 
用 更 为 广泛 ， 因 此 直到 如 何 使 用 test 更 为 重要 。 但 是 [ [ ] ] 命 令 显然 更 有 用 ， 而 
且 更 容易 编码 。 
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可 移植 性 是 狭隘 思想 的 心 魔 

如 果 和 “真正 的 ”的 UNIX 人 员 交 流 ， 就 会 发 现 他 们 中 的 大 部 分 并 不 是 
很 喜欢 Linux。 他 们 认为 Linux 是 不 纯洁 、 不 简洁 的 。UNIX 信徒 的 一 个 信条 
是 Linux 的 一 切 应 该 都 是 可 以 移植 的 。 这 意味 着 你 编写 的 脚本 不 用 修改 就 可 
以 直接 在 任何 一 个 类 UNIX 操作 系统 中 运行 。 

UNIX 人 员 有 足够 的 理由 去 相信 这 些 。 当 在 POSIX 之 前 , 他 们 看 到 UNIX 
命令 和 shell 的 专 有 扩展 对 UNIX 世界 的 影响 之 后 ， 自 然 就 会 担心 Linux 会 对 
他 们 喜欢 的 操作 系统 产生 影响 。 

但 是 可 移植 性 有 一 个 很 严重 的 缺陷 。 它 阻碍 了 进步 ， 它 需要 使 用 “最 小 
公分 母 ” 技术 来 完成 工作 。 在 shell 编程 中 , 这 就 意味 着 所 有 的 事情 要 与 sh( 最 
早 的 Bourne shell ) 兼容 。 

这 种 缺陷 是 专 有 供应 商 的 一 个 借口 , 它们 使 用 该 借口 为 自己 的 专 有 命令 扩展 
进行 辩解 ， 也 只 有 它们 将 其 称 之 为 “创新 ”。 但 它们 只 是 为 客户 锁定 了 设备 而 已 

GNU 工具 ， 比 如 bash， 并 没有 上 述 的 限制 。 它 通过 支持 标准 和 广泛 的 可 
用 性 来 实现 可 移植 性 。 你 可 以 在 几乎 所 有 的 操作 系统 中 安装 bash 和 其 他 的 
GNU 工具 ,甚至 包括 Windows， 并 且 是 免费 的 。 所 以 ， 放 心地 使 用 bash 的 特 
性 吧 。 它 是 真正 可 移植 的 。 


27.7 ”控制 运算 符 : 另 一 种 方式 的 分 支 


bash 还 提供 了 两 种 可 以 执行 分 支 的 控制 运算 符 .“&&”(AND) 和 “||”(OR) 
运算 符 与 [[ ] ] 复 合 命 令 中 的 逻辑 运算 符 类 似 。 语 法 如 下 。 
command1 && command2 


和 


command1 || command2 
理解 这 两 个 运算 符 是 非常 重要 的 。 对 于 “&&” 运 算 符 来 说 ， 先 执行 
command1， 只 有 在 commandl 执行 成 功 时 ，command2 才能 够 执行 。 对 于 “||” 
运算 符 来 说 ， 先 执行 command1， 则 只 有 在 commandl 执行 失败 时 ，command2 
才能 够 执行 。 
从 实用 性 考虑 ， 这 意味 着 可 以 这 样 做 : 


[me@linuxbox -]$ wkdir temp 8& cd temp 
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这 会 创建 一 个 temp 目录 ， 并 且 当 这 个 创建 工作 执行 成 功 后 ， 当 前 的 工作 目 
录 才 会 更 改 为 temp。 只 有 在 第 一 个 mkdir 命令 执行 成 功 后 ， 才 会 尝试 执行 第 二 个 
命令 。 同 样 ， 看 如 下 命令 : 


[me@linuxbox ~]$ [ -d temp ] || mkdir temp 


这 个 命令 先 检 测 temp 目录 是 否 存在 ， 只 有 当 检 测 失败 时 ， 才 会 创建 这 个 目 
录 。 这 种 构造 类 型 可 以 轻松 处 理 脚 本 中 的 错误 ， 后 面 章节 会 对 其 详细 讲解 。 例 如， 
我 们 可 以 在 一 个 脚本 中 这 样 做 : 


[ -d temp ] || exit 1 


如 果 脚 本 需要 目录 temp， 而 这 个 目录 不 存在 ， 则 这 个 脚本 会 终止 ， 并 且 退 
出 状态 为 1。 


27.8 ”本 章 结尾 语 


本 章 以 一 个 问题 开始 。 我 们 怎样 让 sys_info_page 脚本 检测 用 户 是 否 具 有 读 
取 所 有 主 目录 的 权限 呢 ? 通过 我 们 的 入 知 识 ， 我 们 在 report_ home space 函数 
中 增加 以 下 代码 段 ， 就 可 以 解决 这 个 问题 。 


report home space () { 
if [[ $(id -u) -eq 0 ]]; then 
cat <<- _EOF_ 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$(du -sh /home/*)</PRE> 


_EOF_ 
else 
Cat <<- _EOF_ 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$(du -sh $HOME)</PRE> 
_EOF_ 
fi 
return 


我 们 计算 了 id 命令 的 输出 。 通 过 使 用 -u 选项 ，id 命令 会 输出 有 效用 户 的 数 
字 用 户 ID 编号 。 而 超级 用 户 的 编号 总 是 0， 其 他 用 户 的 编号 则 是 一 个 大 于 0 的 
数字 。 知 道 了 这 点 以 后 ， 我 们 就 可 以 创建 两 个 不 同 的 here 文档 ， 一 个 使 用 的 是 
超级 用 户 的 权限 ， 而 另 一 个 则 受 限 于 用 户 自 己 的 主 目录 。 


有 关 sys_info_page 程序 的 内 容 暂时 告 一 段落 。 不 过 不 用 担心 。 这 些 内 容 会 
再 次 出 现 。 同 时 ， 当 我 们 继续 当前 的 工作 时 ， 还 将 讨论 一 些 会 用 得 上 的 主题 。 


4 


读 取 键盘 输入 


迄今 为 止 ， 本 书 所 使 用 的 脚本 都 缺少 了 一 个 大 多 数 程序 所 常见 的 功能 点 
交互 一 一 也 就 是 程序 与 用 户 互 动 的 能 力 。 尽 管 很 多 程序 不 需要 与 用 户 交互 ,但 
对 一 些 程序 来 说 ， 直 接 从 用 户 获取 输入 会 比较 好 。 以 前 面 章节 中 的 脚本 为 例 。 
#i/bin/bash 
# test-integer2: evaluate the value of an integer. 

INT=-5 


if [[ "$INT" =~ “-?[0-9]+$ ]]; then 
if [ $INT -eq 0 ]; then 
echo "INT is zero." 
else 
if [ $INT -lt 0 ]; then 
echo "INT is negative." 
else 
echo "INT is positive." 
fi 
if [ $({INT % 2)) -eq 0 ]; then 
echo "INT is even." 
else 
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echo "INT is odd." 
fi 
fi 
else 
echo "INT is not an integer." >&2 
exit 1 
fi 


每 当 用 户 想 要 改变 INT 变量 的 值 ， 就 必须 修改 脚本 。 若 脚本 能 向 用 户 请 求 
输入 ， 就 方便 多 了 。 本 章节 将 讲解 如 何 向 程序 添加 与 用 户 交互 的 功能 。 


28.1 read 一 一 从 标准 输入 读 取 输入 值 


内 人 嵌 命 令 read 的 作用 是 读 取 一 行 标准 输入 。 此 命令 可 用 于 读 取 键盘 输入 值 
或 应 用 重 定向 读 取 文件 中 的 一 行 。read 命令 的 语法 结构 如 下 所 示 。 
read [-options] [variable...] 

语法 中 options 为 表 28-1 列 出 的 一 条 或 多 条 可 用 的 选项 ， 而 variable 则 是 一 
到 多 个 用 于 存放 输入 值 的 变量 。 若 没有 提供 任何 此 类 变量 ， 则 由 shell 变量 
REPLY 来 存储 数据 行 。 


表 28-1 read 选项 

选项 描述 

-a array 将 输入 值 从 索引 为 0 的 位 置 开始 赋 给 array， 本 书 第 35 章 将 介绍 array 的 相关 内 容 
-d delimiter ”用 字符 串 delimiter 的 第 一 个 字符 标志 输入 的 结束 ， 而 不 是 新 的 一 行 的 开始 

-e 使 用 Readline 处 理 输入 。 此 命令 使 用 户 能 使 用 命令 行 模 式 的 相同 方式 编辑 输入 
-n num 从 输入 中 读 取 num 个 字符 ， 而 不 是 一 整 行 

-p prompt 使 用 prompt 字符 串 提示 用 户 进行 输入 


工 原始 模式 。 不 能 将 后 斜 线 字符 翻译 为 转 义 码 

-Ss 保密 模式 。 不 在 屏幕 显示 输入 的 字符 。 此 模式 在 输入 密码 和 其 他 机 密 信息 时 很 有 用 处 
-t seconds 超时 。 在 seconds 秒 后 结束 输入 。 若 输入 超时 ，read 命令 返回 一 个 非 0 的 退出 状态 
-ufd 从 文件 说 明 符 乌 读 取 输 入 ， 而 不 是 从 标准 输入 中 读 取 


基本 上 ，read 命令 将 标准 输入 的 字段 值 分 别 赋 给 指定 的 变量 。 若 使 用 read 
命令 改写 之 前 的 整数 验证 脚本 ， 可 能 如 下 所 示 。 
#1 /bin/bash 
# read-integer: evaluate the value of an integer. 


echo -n "Please enter an integer -> “ 
read int 
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if [[ “$int" =~- ^-?[0-9]+$ ]]; then 
if [ $int -eq 0 ]; then 
echo "$int is zero." 


else 
if [ $int -lt 0 ]; then 
echo "$int is negative." 
else 
echo "$int is positive,." 
fi 
if [ $((int % 2)) -eq 0 ]; then 
echo "$int is even." 
else 
echo "$int is odd." 
fi 
fi 
else 
echo "Input value is not an integer." >&2 
exit 1 
fi 


我 们 使 用 带 有 -n 选项 (使 接 下 来 的 输出 在 下 一 行 显示 ) 的 echo 命令 来 输出 
一 条 提示 符 ， 然 后 使 用 read 命令 给 int 变量 赋值 。 此 脚本 的 运行 结果 如 下 所 示 。 


[me@linuxbox -]$ read-integer 
Please enter an integer -> 5 
5 is positive. 

5 is odd. 


在 下 述 脚 本 中 ，read 命令 将 输入 值 赋 给 多 个 变量 。 


#1/bin/bash 
# read-multiple: read multiple values from keyboard 


echo -n "Enter one or more values > " 
read var1 var2 var3 var4 var5 


echo "vari1 = '$var1'… 
echo "var2 = ‘'$var2'" 
echo "var3 = '$var3'" 
echo "var4 = '$var4'… 
echo "var5 = '$var5'" 


此 脚本 可 以 给 5 个 变量 赋值 并 输入 。 需 要 注意 当 输 入 少 于 或 多 于 5 个 值 的 
时 候 ，read 的 运作 方式 如 下 。 


[me@linuxbox ~]$ read-multiple 
Enter one or more values > & bcde 


Var1 = 'a' 
Var2 = 'b' 
Var3 = 'C! 
Var4 = 'd 
Var5 = 'e' 


[me@linuxbox ~]$ read-multiple 
Enter one or more values > & 
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Var1 = 'a' 

var2 = "" 

Var3 = '"! 

Var4 = '" 

Var5 = ' 

[me@linuxbox ~]$ read-mulitiple 

Enter one or more values > a bcdefqg 


Varf = 'a' 
var2 = 'b， 
Var3 = 'C! 
Var4 = 'd' 


var5 = 'efg' 


若 read 命令 读 取 的 值 少 于 预期 的 数目 ， 则 多 余 的 变量 值 为 空 ， 而 输入 值 的 
数目 超出 预期 的 结果 时 ， 最 后 的 变量 包含 了 所 有 的 多 余 值 。 


如 果 read 命令 之 后 没有 变量 ， 则 会 为 所 有 的 输入 分 配 一 个 shell 变量 ， REPLY 。 


#!/bin/bash 


# read-single: read multiple values into default variable 


echo -n "Enter one or more values > " 
read 


echo “REPLY = '$REPLY'" 
以 上 脚本 的 运行 结果 如 下 所 示 。 
[me@linuxbox ~]$ read-single 


Enter one or more values > & bed 
REPLY = 'a bcecd’' 


28.1.1 选项 
read 命令 支持 的 选项 如 前 面 的 表 28-1 所 示 。 
使 用 不 同 的 选项 ，read 命令 可 以 达成 不 同 的 有 趣 的 效果 。 例 如 ， 可 使 用 -p 
选项 来 显示 提示 符 : ， 
#!/bin/bash 
# read-single: read multiple values into default variable 
read -p "Enter one or more values > “ 
echo "REPLY = '$REPLY'" 
使 用 -t 与 -s 选项 ， 可 以 写 出 读 取 “秘密 ”输入 的 脚本 ， 此 脚本 车 一 定时 间 
内 没有 完成 输入 ， 会 造成 超时 。 
#!1/bin/bash 


# read-secret: input a secret passphrase 
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if read -t 10 -Sp "Enter Secret passphrase > " secret pass; then 
echo -e "\nSecret passphrase = '$secret pass'" 

else 
echo -e "\ninput timed out" >&2 
exit 1 

fi 


上 述 脚 本 会 提示 用 户 输入 秘密 通行 短语 ， 系 统 的 等 待 时 间 为 10 秒 。 若 10 
秒 内 用 户 没有 完成 输入 ， 脚 本 以 出 错 状 态 结束 运行 。 又 因为 使 用 了 -s 选项 ， 输 
入 的 密码 并 不 会 显示 到 屏幕 上 。 


28.1.2 ”使 用 IFS 间隔 输入 字段 
通常 shell 会 间隔 提供 给 read 命令 的 内 容 。 这 也 就 意味 着 ， 在 输入 行 ， 由 一 
到 多 个 空格 将 多 个 单词 分 隔 成 为 分 离 的 单项 ， 再 由 read 命令 将 这 些 单项 赋值 给 
不 同 的 变量 。 此 行为 是 由 shell 变量 IFS (Internal Field Separator) 设 定 的 。IFS 
的 默认 值 包含 了 空格 、 制 表 符 和 换行 符 ， 每 一 种 都 可 以 将 字符 彼此 分 隔 开 。 
我 们 可 以 通过 改变 IFS 值 来 控制 read 命令 输入 的 间隔 方式 。 例 如 ， 文 件 
/etc/passwd 的 内 容 使 用 冒号 作为 字段 之 间 的 间隔 符 。 将 IFS 的 值 改 为 单个 冒号 
即 可 使 用 read 命令 读 取 /etc/passwd 文件 的 内 容 ， 并 成 功 将 各 字段 分 隔 为 不 同 的 
变量 。 下 面 的 脚本 就 完成 了 此 功能 。 
#!/bin/bash 
# read-ifs: read fields from a file 
FILE=/etc/passwd 
read -p "Enter a username > * user_name 
file info=$(grep "“S$user name:" $FILE) DD 


if [ -n “$file info" ]; then 
IFS=":" read user pw uid gid name home shell <<< "$file info" ©®@ 


echo "User = “Suser 
echo "UID = ‘S$uid'" 
echo "GID = '$gid'" 
echo "Full Name = '$name' 
echo "Home Dir. = “$home' 
echo "Shell = '$shell'" 
else 
echo “NO such user ‘$user name'" >&2 
exit 1 
fi 


此 脚本 提示 用 户 输入 系统 账户 的 用 户 名 ， 根 据 用 户 名 找到 /etc/passwd 文件 
中 相应 的 用 户 记录 ， 并 输出 此 记录 的 各 个 字段 。 此 丢 本 包含 了 两 行 有 趣 的 代码 。 
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第 一 行 位 于 2, 它 将 grep 命令 的 结果 赋值 给 file_info 变量 。grep 命令 使 用 的 正则 
表达 式 保证 了 用 户 名 只 会 与 /etc/passwd 文件 中 的 一 条 记录 相 匹 配 。 

第 二 行 这 有 趣 的 代码 位 于 8， 是 由 三 部 分 构成 的 ， 即 一 条 变量 赋值 语句 一 条 
带 有 变量 名 作 参 数 的 read 命令 和 一 个 陌生 的 重 定向 运算 符 。 首 先 让 我 们 看 一 下 
其 中 的 变量 赋值 语句 。 

shell 人 允许 在 命令 执行 之 前 对 一 到 多 个 变量 进行 赋值 ， 这 些 赋值 操作 会 改变 
接 下 来 所 执行 命令 的 操作 环境 。 但 是 赋值 的 效果 是 暂时 性 的 ， 只 有 在 命令 执行 
周期 内 有 效 。 本 例 中 ，IFS 的 值 被 修改 为 一 个 冒号 。 我 们 也 可 以 通过 以 下 方式 达 
到 此 效果 。 
OLD_ IFS-" $IFS" 
IFS=":* 


read user pw uid gid name home sheil <<< "$file info" 
IFS="$0LD IFS" 


首先 我 们 储存 了 IFS 的 旧 值 ， 并 将 新 值 赋 给 IFS， 我 们 执行 了 read 命令 
最 后 将 IFS 恢复 原 值 。 显 然 ， 对 于 做 相同 的 事情 ， 将 变量 赋值 语句 置 于 执行 
命令 前 ， 是 更 为 简洁 的 方法 。 

操作 符 “<<<” 象 征 一 条 灵 入 字符 串 。 绒 入 字符 串 与 嵌入 文档 类 似 ， 只 不 过 
更 为 简短 ， 它 包含 的 是 一 条 字符 串 。 本 例 将 /ete/passwd 文件 中 读 取 的 数据 输送 
给 read 命令 。 读 者 或 许 会 疑惑 为 什么 使 用 这 么 复杂 的 方法 而 不 是 如 下 方法 。 


echo "$file info" | IFS=":" read user pw uid gid name home shell 
原因 如 下 。 
read 不 可 重 定向 
通常 read 命令 会 从 标准 输入 中 获取 输入 ， 而 不 能 采用 以 下 方式 。 
echo "foo" | read 


这 种 方法 看 起 来 可 行 ， 实 则 不 然 。 看 似 命令 能 够 执行 成 功 ， 但 是 REPLY 
总 是 空 值 。 为 什么 会 出 现 这 样 的 现象 ? 
这 主要 是 由 于 shell 处 理 管道 的 方式 。 在 bash (和 其 他 shell， 如 sh) 中 ， 
管道 会 创造 子 shell. 子 shell 复制 了 shell 及 pipeline 执行 命令 过 程 中 使 用 到 的 
shell 环境 。 前 例 中 ，read 命令 就 是 在 子 shell 中 执行 的 。 

类 UNIX 系统 的 子 shell 会 为 执行 进程 复制 所 需 的 shell 环境 .进程 结束 后 ， 
所 复制 的 shell 环境 即 被 销毁 , 这 意味 着 子 shell 永远 不 会 改变 父 类 进程 的 shell 


亦 号 
并 里 
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环境 。read 命令 给 变量 赋值 ， 这 些 变 量 会 成 为 shell 环境 的 一 部 分 。 而 在 上 述 范 
例 中 ，read 将 变量 foo 的 值 赋 给 子 shell 环境 中 的 REPLY 变量 ， 但 是 当 命令 退出 
时 ， 子 shell 与 其 环境 就 会 被 销毁 ，read 命令 的 赋值 效果 也 就 丢失 了 。 

嵌入 字符 囊 是 解决 此 类 问题 的 方法 之 一 ,在 第 36 章 我 们 将 介绍 另外 一 种 
办 法 。 


28.2 ”验证 输入 


在 程序 具备 了 读 取 键 盘 输入 功能 的 同时 ， 也 带 来 了 新 的 编程 上 的 挑战 一 一 
验证 输入 。 通 常 来 说 ， 程 序 写 得 好 与 不 好 的 差别 仅仅 在 于 程序 是 否 能 够 处 理 突 
发 意外 情况 。 而 意外 情况 经 常 以 错误 输入 的 形式 出 现 。 前 一 章节 的 评估 程序 涉 
及 到 了 少量 此 类 操作 ， 程 序 检查 整数 变量 的 值 并 筛选 出 空 值 与 非 数值 的 字符 。 
对 所 有 程序 接收 的 输入 执行 此 类 验证 是 防御 无 效 数 据 的 重要 方式 ， 且 对 于 多 用 
户 共享 的 程序 尤其 重要 。 只 有 那些 执行 特殊 任务 且 只 会 被 作者 使 用 一 次 的 程序 ， 
出 于 经 济 学 原理 可 以 省 略 这 些 安全 措施 。 尽 管 如 此 ， 若 程序 执行 的 是 像 删除 文 
件 这 样 的 危险 任务 ， 为 以 防 万 一 还 是 进行 数据 验证 会 比较 好 。 


以 下 是 一 个 对 不 同类 型 输入 进行 验证 的 程序 。 
#1/bin/bash 


# read-validate: validate input 


invalid input () { 
echo "Invalid input '$REPLY'" >&2 
exit 1 


} 
read -p "Enter a single item > “ 


# input is empty (invalid) 
[[ -z $REPLY ]] && invalid input 


# input is multiple items (invalid) 
(( $(echo $REPLY | we -w) > 1 )) 8&& invalid input 


# is input a valid filename? 
if [[ $REPLY =~ “[-[:alnum:]\._]+$ ]]; then 
echo "'$REPLY' is a valid filename." 
if [[ -e $REPLY ]]; then 
echo "And file '$REPLY' exists." 
else 
echo "However, file '$REPLY' does not exist." 
fi 
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else 


fi 


此 脚本 首先 提示 用 户 进行 输入 ， 然 后 分 析 确 定 用 户 的 输入 。 肢 本 使 用 了 很 
多 本 书 至 今 为 止 涵盖 的 概念 ， 包 括 shell 函数 、[[ ]]、(( ))、 控 制 操 作 符 &&&、if 


# is input a floating point number? 
if [{ $REPLY =~ ~“-?[[:digit:]]*\.[[:digit:]]+$ ]]; then 
echo “'$REPLY' is a floating point number.”" 
else 
echo "'$REPLY' is not a floating point number.” 
fi 


# is input an integer? 
if [[ $REPLY =~ “-?[[:digit:]]+$ ]]; then 
echo "'$REPLY' is an integer." 
else 
echo “'$REPLY' is not an integer." 
fi 


echo "The string ‘S$REPLY' is not a Valid filename.”" 


以 及 适量 的 正则 表达 式 。 


28.3 ”菜单 


菜单 驱动 是 一 种 常见 的 交互 方式 。 在 菜单 驱动 的 程序 会 呈现 给 用 户 一 系列 
的 选项 ， 并 请 求 用 户 进行 选择 。 例 如 ， 可 想象 程序 呈现 的 菜单 如 下 所 示 。 


Please Select: 


OWND-= 


. Quit 


. Display System Information 
. Display Disk Space 
. Display Home Space Utilization 


Enter selection [0-3] > 


根据 写 sys_info_page 程序 得 到 的 经 验 ， 我 们 可 以 构建 菜单 驱动 的 程序 来 执 


行 上 述 菜 单 中 各 项 任务 。 


#1/bin/bash 


# read-menu: a menu driven System information program 


ciear 
echo “ 


Please Select: 


局 办 及 至 


。Quit 


。 Display System Information 
. Display Disk Space 
. Display Home Space Utilization 
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read -p "Enter selection I0-3] > " 


if [[ $REPLY =~ “[0-3]$ ]]; then 
if [[ $REPLY == 0 ]]; then 
echo "Program terminated." 
exit 


fi 
if [[ $REPLY == 1 ]]; then 
echo “Hostname: $HOSTNAME" 
uptime 
e@xit 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 


exit 
fi 
if [[ $REPLY == 3 ]]; then 
if [{ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization {All Users)" 
du -sh /home/* 


else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 

fi 

@xit 


fi 
else 
echo "Invalid entry." >&2 
exit 1 
fi 


脚本 在 逻辑 上 分 隔 为 两 个 部 分 。 第 一 部 分 展示 了 菜单 并 获取 用 户 的 响应 ， 
第 二 部 分 对 响应 进行 验证 并 执行 相应 的 选项 。 需 要 注意 脚本 中 exit 命令 的 使 
用 方法 。 在 完成 选 定 的 功能 后 ，exit 可 防止 脚本 继续 执行 多 余 的 代码 。 程 序 
多 出 口 通 常 并 不 是 一 个 好 现象 (会 导致 程序 逻辑 难以 理解 ), 但 是 在 上 述 脚 本 
中 适用 。 


28.4 ”本 登 结尾 语 


本 章节 迈 出 了 程序 交互 的 第 一 步 ， 允许 用 户 通 过 键盘 向 程序 提供 输入 数据 。 
使 用 迄今 为 止 本 书 讲解 过 的 技术 ， 用 户 已 经 能 够 写 出 很 多 不 同 功效 的 程序 ， 如 
专门 的 计算 程序 和 易 用 的 命令 行 工具 前 端 。 下 一 章 我 们 将 在 菜单 驱动 程序 概念 
的 基础 上 对 其 进行 改进 。 
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28.5 ”附加 项 


因为 接 下 来 的 程序 会 变 得 更 加 复杂 ， 所 以 就 需要 用 户 认真 学 习 并 完全 理解 
本 章节 程序 的 逻辑 构建 方式 。 作 为 练习 ， 用 户 可 使 用 test 命令 替代 “[[]1” 复 合 
命令 来 改写 本 章节 中 的 程序 。 提 示 : 使 用 grep 命令 处 理 正则 表达 式 ， 然 后 评估 
其 退出 状态 。 这 将 是 个 很 好 的 练习 。 


4 


流 控 制 : WHILE 和 UNTIL 循环 


前 面 的 章节 我 们 曾 构 建 过 一 个 菜单 驱动 的 程序 ， 用 来 提供 不 同 的 系统 信息 。 
此 程序 能 有 效 地 运作 ， 但 是 却 存 在 着 重大 的 可 用 性 问题 一 一 程序 在 执行 一 次 选择 
之 后 即 终止 运行 。 更 糖 糕 的 是 ， 若 用 户 做 出 了 无 效 的 选择 ， 那 么 程序 会 立刻 以 错 
误 状 态 终 止 ， 用 户 没有 再 次 尝试 的 机 会 。 如 果 能 够 用 某 种 方法 重 构 程 序 ， 让 程序 
能 够 一 遍 一 遍地 展示 菜单 选项 ， 一 直到 用 户 选择 退出 程序 ， 这 样 会 好 得 多 。 

本 章节 将 讲解 叫做 循环 的 编程 概念 ， 用 于 重复 执行 部 分 程序 。shell 为 循环 
提供 了 三 种 复合 命令 。 本 章节 会 介绍 其 中 的 两 种 ， 第 33 章 中 介绍 第 三 种 。 


29.1 循环 


日 常生 活 充满 了 循环 。 每 天 上 班 、 多 狗 和 切 胡 葛 卜 等 都 需要 重复 一 系列 的 
步骤 。 就 比如 用 伪 代码 来 描述 切 胡 萝卜 的 过 程 ， 可 能 会 是 这 样 的 。 


1. 取 案 板 。 
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取 刀 。 

.把 胡 葛 卜 放 在 案板 上 。 

拿 起 刀 。 

前 移 胡 上 萝卜。 

. 切 胡萝卜 。 

. 车 整 根 胡 萝卜 都 切 好 了 ， 就 退出 程序 ， 否 则 继续 从 第 4 步 开始 操作 。 


第 4 步 到 第 7 步 构成 了 一 个 循环 。 循 环 中 的 动作 会 一 直 重复 , 直到 条 件 “ 整 
根 胡萝卜 都 切 好 了 ”为 真 。 


29.2 While 


bash 可 以 表达 出 类 似 的 过 程 。 若 要 按 顺 序 显示 1 一 5 这 5 个 数字 ， 就 可 以 构 

建 这 样 的 bash 脚本 。 
#1!/bin/bash 
# while-count: display a series of numbers 
count=1 
while [ $count -le 5 ]; do 

echo $count 

count=${ (count + 1)) 


done 
echo "Finished,." 


脚本 的 执行 结果 如 下 所 示 。 


[me@linuxbox ~]$ while-count 


On WP 一 


Finished, 
while 命令 的 语法 结构 如 下 。 
while commands; do commands; done 
就 如 同 让 命令 一 样 ，while 会 判断 一 系列 指令 的 退出 状态 。 只 要 退出 状态 为 


0， 它 就 执行 循环 内 的 命令 。 上 述 脚 本 中 ， 我 们 创建 了 count 变量 并 赋予 count 初始 
值 1。while 命令 会 判断 test 命令 的 退出 状态 。 只 要 test 命令 返回 的 退出 状态 为 0， 
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那么 循环 内 的 指令 继续 执行 。 在 每 个 循环 周期 的 末尾 ， 重 复 执 行 test 命令 。 在 
经 过 6 次 循环 迭代 后 ，count 变量 的 值 增加 至 6， 此 时 test 命令 返回 的 退出 状态 
就 不 再 是 0， 循 环 终止 。 接 下 来 程序 会 进一步 执行 循环 后 面 的 语句 。 


我 们 可 以 使 用 while 循环 改进 第 28 章 中 的 read-menu 程序 。 


#!1/bin/bash 
# while-menu: a menu driven system information program 
DELAY=3 # Number of seconds to display results 


while [[ S$REPLY != 0 ]]; do 


clear 
cat <<- _EOF_ 
Please Select: 
1. Display System Information 
2. Display Disk Space 
3. Display Home Space Utilization 
0，Quit 
EOF_ 


read -p "Enter selection [0-3] > "* 


if [[ $REPLY =~ “[0-3]$ ]]; then 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 
uptime 
sleep $DELAY 
fi 
if [[ $REPLY == 2 ]]; then 
dc - 
sleep $DELAY 
fi 
if [[ $REPLY == 3 ]]; then 
if {[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 


else 
echo "Home Space Utilization {$USER)" 
du -sh $HOME 
fi 
sleep $DELAY 
fi 
else 
echo "Invalid entry." 
sleep $DELAY 
fi 


done 
echo "Program terminated." 


将 菜单 封装 到 while 循环 内 ， 程 序 就 可 以 在 用 户 每 次 选择 后 重复 展示 菜单 
项 。 只 要 REPLY 值 不 为 0， 重复 循环 ， 展 示 菜 单项 ， 给 用 户 又 一 次 进行 选择 的 
机 会 。 而 在 每 次 动作 结束 时 ， 系 统 执行 sleep 命令 使 程序 暂停 几 秒 ， 让 用 户 能 看 
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到 选择 执行 的 结果 ， 随 后 程序 清空 屏幕 显示 并 再 次 展示 菜单 项 。 一 旦 REPLY 值 
为 0， 也 就 意味 着 用 户 选 择 了 退出 项 ， 循 环 终止 ， 程 序 进一步 执行 done 之 后 的 
代码 。 


29.3 ”跳出 循环 


bash 提供 了 两 种 可 用 于 控制 循环 内 部 程序 流 的 内 建 命 令 。 其 中 break 命令 
立即 终止 循环 ， 程 序 从 循环 后 的 语句 恢复 执行 。continue 命令 则 会 导致 程序 跳 过 
循环 剩余 的 部 分 ， 直 接 开始 下 一 次 循环 友 代 。 下 面 这 个 版 本 的 while-menu 程序 
实际 应 用 了 break 和 continue。 


#!/bin/bash 
# while-menu2: a menu driven System information program 
DELAY=3 # Number of seconds to display results 


while true; do 
clear 
cat <<- _EOF_ 
Please Select: 


Display System Information 
Display Disk Space 

Display Home Space Utilization 
Quit 


OnND-= 


_EOF_ 
read -p "Enter selection [0-3] > " 


if [[ $REPLY =~ “{0-3]$ ]]; then 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME* 
uptime 
sleep $DELAY 
continue 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
Sleep $DELAY 
continue 
fi 
if [[ $REPLY == 3 ]]; then 
if [[ ${id -u) -eq 0 1]; then 
echo "Home Space Utilization (ALL Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER})" 
du -sh $HOME 
fi 
sleep S$DELAY 
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Continue 
fi 
if [[ S$REPLY == 0 ]]; then 
break 
fi 
else 
echo "Invalid entry." 
sleep $DELAY 
fi 


done 
echo "Program terminated." 


这 个 版 本 的 程序 脚本 构建 了 一 个 无 限 循 环 (无限 循环 永远 不 会 自动 终 
止 )， 利 用 true 命令 向 while 提供 退出 状态 。 因 为 true 退出 时 的 状态 总 为 0， 
所 以 循环 永远 都 不 会 停止 。 这 是 一 个 很 常见 的 脚本 技术 。 因 为 循环 永远 不 能 
自动 终止 ， 所 以 需要 程序 员 提 供 在 适当 的 时 刻 跳出 循环 的 方式 。 当 用 户 选 择 
为 0 时， 脚本 使 用 break 命令 来 终止 循环 。 为 了 使 脚本 执行 更 加 高 效 ， 可 以 在 
其 他 脚本 选项 的 末端 使 用 了 continue。 在 确认 用 户 做 出 了 选择 后 ，continue 让 
脚本 跳 过 了 不 需要 执行 的 代码 。 例 如 ， 若 确认 用 户 选 择 了 1， 那么 没有 必要 验 
证 其 他 选项 了 。 


29.4 until 


while 命令 退出 状态 不 为 0 时 终止 循环 ， 而 until 命令 则 刚好 相反 。 除 此 之 
外 ，until 命令 与 while 命令 很 相似 。unti 循环 会 在 接收 到 为 0 的 退出 状态 时 终 
止 。 在 while-count 脚本 中 , 循环 会 一 直 重 复 到 count 变量 小 于 等 于 $。 使 用 until 
改写 脚本 也 可 以 达到 相同 的 效果 。 


#1/bin/bash 
# until-count: display a series of numbers 
count=1 


until [ $count -gt 5 ]; do 
echo $count 
count=$( (count + 1)) 
done 
echo “Finished." 


将 测试 表达 式 改 写 为 $count -gt 5，until 就 可 以 在 合适 的 时 刻 终止 循环 。 选 
择 使 用 while 还 是 until， 通 常 取决 于 哪 种 循环 能 够 允许 程序 员 写 出 最 明了 的 测 
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29.5 “使 用 循环 读 取 文 件 


while 和 until 可 处 理 标准 输入 ， 这 让 使 用 while 和 until 循环 处 理 文件 成 为 
可 能 。 本 书 前 面 的 章节 曾 使 用 过 distros.txt 文件 ， 接 下 来 的 示例 显示 了 该 文件 的 
内 容 。 
Wbinbash OO 
# while-read: read lines from a file 


while read distro version release; do 
printf "Distro: %s\tVersion: %s\tReleased: %s\n" \ 
$distro \ 
$version 
$release 
done < distros.txt 


为 将 一 份 文件 重 定向 到 循环 中 ， 我 们 可 在 done 语句 之 后 添加 重 定向 操作 符 。 
循环 使 用 read 命令 读 取 重 定向 文件 中 的 字段 。 在 到 达 文 件 末端 之 前 ， 退 出 状态 
为 0。 在读 取 过 文件 中 的 每 一 行 之 后 ，read 命令 退出 ， 此 时 退出 状态 变 为 非 0， 
循环 终止 。 将 标准 输入 重 定向 到 循环 中 也 是 可 以 做 到 的 。 

#!1/bin/bash 
# while-read2: read lines from a file 


sort -k 1,1 -k 2n distros.txt | while read distro version release; do 
printf “Distro: %s\tVersion: %s\tReleased: %s\n" \ 
$distro \ 
$version \ 
$release 
done 


此 脚本 获取 sort 命令 的 输出 并 显示 文本 流 。 但 需要 留意 的 是 ， 因 为 管道 是 
在 子 shell 中 进行 循环 操作 。 当 循环 终止 时 ， 循 环 内 部 新 建 的 变量 或 者 是 对 变量 
的 赋值 效果 都 会 丢失 。 


29.6 本章 结尾 语 


在 介绍 过 循环 ， 讲 解 过 分 支 、 子 进程 和 队列 之 后 ， 本 书 已 经 讲解 了 编程 使 
用 的 几 种 主要 的 流 控制 方法 。bash 还 提供 了 很 多 其 他 的 方法 ， 但 这 些 方法 也 只 
是 对 这 些 基 本 概念 的 改进 。 


随 着 脚本 的 复杂 度 越 来 越 高 ， 当 脚本 出 现 错误 或 执行 情况 和 预期 不 同 的 时 
候 ， 就 需要 看 看 是 哪里 出 的 问题 。 本 章 将 讲解 一 些 脚 本 中 常见 的 错误 类 型 以 及 
几 种 用 于 追踪 和 解除 错误 的 有 用 技巧 。 


30.1 语法 错误 
语法 错误 是 一 种 常见 的 错误 类 型 ， 其 中 就 包括 了 shell 语句 中 一 些 元 素 的 拼 
写 错误 。 在 大 多 数 情况 下 ，shell 会 拒绝 执行 含有 此 种 类 型 错误 的 脚本 。 
在 接 下 来 的 讨论 过 程 中 ， 我 们 将 使 用 以 下 脚本 来 演示 常见 的 错误 类 型 。 
#!1/bin/bash 
# trouble: script to demonstrate common errors 
number=1 


if [ $number = 1 ]; then 
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echo "Number is equal to 1.°" 
else 
echo “Number is not equal to 1.°" 


可 以 看 到 ， 此 脚本 运行 正常 。 


[me@linuxbox ~]$ trouble 
Number is equal to 1. 


30.1.1 引号 缺失 
现在 修改 上 述 脚本 ， 删 除 第 一 个 echo 命令 后 实 参 后 的 双 引 号 。 


#!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
if [ $number = 1 ]; then 
echo “Number is equal to 1. 
else 


echo "Number is not equal to 1.°" 
fi 


观察 出 现 的 现象 如 下 所 示 。 


[me@linuxbox ~]$ trouble 
/home/me/bin/trouble: line 10: unexpected EOF while looking for matching ‘"' 
/home/me/bin/trouble: line 13: syntax error: unexpected end of file 


此 删除 操作 使 脚本 产生 了 两 个 错误 。 有 趣 的 是 ， 错 误 报告 指出 的 行 并 不 是 
之 前 所 删除 双 引 号 所 在 的 行 ， 而 是 之 后 的 代码 。 可 以 看 到 ， 当 系统 读 取 到 所 删 
除 双 引 号 的 位 置 之 后 ，bash 将 继续 向 下 寻找 与 前 双 引 号 对 应 的 引号 ， 这 样 的 行 
为 会 一 直 延 续 到 bash 找到 目标 ， 也 就 是 在 第 二 个 echo 命令 后 的 第 一 个 引号 处 。 
然后 bash 就 陷入 了 混乱 中 ， 即 寺 命 令 的 语法 结构 被 破坏 了 ， 直 语句 现在 处 于 了 
引号 标识 〈 但 是 又 只 有 一 边 存在 引号 ) 的 字符 串 中 。 


这 种 类 型 的 错误 在 长 脚本 中 很 难 发 现 ， 而 使 用 带 有 语法 结构 突出 显示 功能 
的 编辑 器 能 够 帮助 找到 这 类 错误 。 如 果 系 统 配备 的 是 完整 版 的 vim， 可 使 用 以 
下 命令 启用 vim 的 语法 结构 突出 显示 功能 。 


:Syntax on 


30.1.2 符号 缺失 宛 余 
男 一 种 常见 的 错误 是 如 站 或 while 这 样 的 复合 命令 结构 不 完整 。 现 在 就 删 
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除 半 命令 中 test 部 分 后 的 分 号 ， 看 看 会 产生 什么 情况 。 


#1! /bin/bash 
# trouble: script to demonstrate common errors 
number=1 


if [ $number = 1 1 then 

echo "Number is equal to 1." 
else 

echo "Number is not equal to 1." 
fi 


结果 如 下 所 示 。 


[meelinuxbox ~]$ trouble 
/home/me/bin/trouble: line 9:; syntax error near Unexpected token 'else' 
/home/me/bin/trouble: line 9: 'else' 


再 一 次 ， 报 错 信息 指向 的 代码 远 在 实际 问题 之 后 ， 这 个 现象 的 机 理 非 常 有 
趣 。 事 实 是 ，if 接收 一 系列 的 命令 ， 并 评估 系列 中 最 后 一 个 命令 为 退出 码 。 在 
本 程序 中 ， 这 个 命令 系列 只 由 一 条 命令 组 成 ,“[,” 即 test 的 同 义 表示 。“[” 命 
令 将 其 之 后 的 部 分 视 为 一 系列 的 参数 一 一 本 例 中 也 就 是 “$number”、“=”、“1” 
和 “]”。 在 分 号 被 删除 之 后 ， 单 词 then 也 就 被 添加 到 了 参数 系列 中 ， 这 在 语法 
中 也 是 允许 的 。 接 下 来 的 echo 命令 也 是 合法 的 ，echo 被 翻译 为 ff 接收 的 命令 列表 
中 的 另 一 条 命令 ， 并 成 为 让 命令 的 退出 码 。 最 后 遇 到 的 就 是 else， 但 是 因为 else 
是 shell 的 保留 单词 (在 shell 中 有 特定 的 含义 )， 并 不 是 命令 的 名 称 ， 所 以 else 
不 应 该 出 现在 这 里 。 因 此 才 有 了 如 上 的 报错 信息 。 


30.1.3 ” 非 预 期 的 展开 


有 一 些 脚 本 错误 是 间歇 出 现 的 。 脚 本 有 时 候 会 运行 正常 ， 有 时 候 又 会 因为 
展开 的 结果 而 出 错 。 现 在 将 缺失 的 分 号 补 回 并 改变 number 的 值 为 空 ， 即 可 以 演 
#!/bin/bash 
# trouble: script to demonstrate common errors 


number= 
if [ $number = 1 ]; then 

echo "Number is equal to 1.”" 
else 

echo “Number is not equal to 1.° 
fi 
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运行 修改 过 的 脚本 得 到 的 输出 结果 如 下 所 示 。 


[me@linuxbox ~]$ trouble 
/home/me/bin/trouble: line 7: [: =: unary operator expected 
Number is not equal to 1. 


也 就 是 一 条 看 起 来 很 深奥 的 报错 信息 ， 外 加 上 脚本 第 二 条 echo 命令 的 输出 
结果 。 造 成 问题 的 原因 是 test 命令 中 number 变量 的 展开 。 当 命令 


[ $number = 1 ] 


expansion 情形 为 number 变量 为 空 ， 就 造成 了 这 样 的 情况 。 


[=1] 

等 式 无 效 , 也 就 产生 了 错误 。“=” 是 一 个 二 元 操作 符 (要 求 符号 两 边 都 有 值 )， 
但 是 本 例 中 缺少 了 一 个 值 ， 所 以 test 命令 要 求 程序 改 用 一 元 操作 符 〈( 如 -z)。 接 
下 来 ， 因 为 test 不 成 立 〈 因 为 上 述 错误 )， 让 命令 接收 到 了 一 个 非 零 的 退出 码 ， 
从 而 执行 了 第 二 个 echo 命令 。 

用 户 可 以 通过 在 test 命令 中 使 用 双 引 号 引用 第 一 个 参数 方式 更 正 这 个 错误 。 
[ "$number" = 1 ] 

现在 展开 命令 ， 结 果 是 这 样 的 。 
[""=11]1 


“=” 的 前 后 有 了 正确 数量 的 参数 。 除 了 空 字符 串 需 要 引用 之 外 ， 类 似 包 含 
空格 的 文件 名 这 样 的 多 字符 的 字符 串 也 要 前 后 加 以 引号 。 


30.2 ”逻辑 错误 


与 语法 错误 不 同 的 是 ， 逻 辑 错 误 不 会 阻碍 脚本 的 运行 。 因 为 脚本 包含 的 罗 
辑 问题 ， 脚 本 尽管 可 以 运行 但 是 不 能 产生 理想 的 结果 。 可 能 发 生 的 逻辑 错误 有 
非常 多 种 ,但 是 以 下 几 种 逻辑 错误 是 脚本 中 最 常见 的 。 


。 条 件 表达 错误 。 编 写 代 码 中 ， 很 容易 写 出 不 正确 的 if、then 和 else 语句 ， 
造成 错误 的 逻辑 ， 例 如 相反 的 或 者 不 完整 的 逻辑 表达 。 

。 “从 工 开始 ”错误 。 在 使 用 计数 器 的 循环 中 ， 可 能 会 忽略 程序 需要 从 0 而 
不 是 1 开始 计数 才能 在 正确 的 点 结束 循环 。 这 种 错误 会 导致 循环 次 数 过 多 ， 
超过 了 预期 的 终点 ， 或 循环 次 数 过 少 ， 缺 失 了 最 后 一 次 的 迭代 过 程 。 
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。 非 预期 的 情形 。 大 多 数 此 种 错误 来 源 于 程序 运行 过 程 遇 到 了 编写 程序 人 员 
没有 预期 到 的 数据 或 环境 。 非 预期 展开 也 包括 在 内 ， 如 一 个 包括 了 空格 的 
文件 名 本 应 该 作为 单个 文件 名 存在 ， 却 扩展 成 为 了 多 个 命令 的 实 参 。 


30.2.1 ”防御 编程 


在 编程 中 核实 各 项 假设 是 很 重要 的 事情 ， 这 意味 我 们 着 需要 对 程序 的 退出 
状态 以 及 脚本 所 用 命令 进行 仔细 评估 。 有 一 个 真实 的 例子 ， 一 位 倒霉 的 系统 管 
理 员 写 了 一 个 脚本 ， 用 于 对 一 台 重 要 的 服务 器 执行 维护 任务 ， 这 个 脚本 包含 了 
这 样 两 行 代码 。 


cd $dir_name 
rm * 


只 要 名 为 dir_ name 的 目录 存在 ， 以 上 两 行 代码 并 没有 什么 本 质 性 的 错误 。 
但 是 ， 如 果 目 标 不 存在 又 会 发 生 什 么 呢 ? 此 情形 下 ，ed 命令 跳 转 失败 ， 脚 本 继 
续 读 取 下 一 行 代码 ， 删 除 的 就 是 当前 的 工作 目录 。 完 全 不 是 管理 员 想 要 的 结果 ! 
出 于 这 样 的 设计 ， 这 位 管理 员 不 幸 地 删除 了 服务 器 一 个 重要 的 部 分 。 | 

现在 就 看 看 改进 此 设计 的 一 些 方法 。 第 一 种 可 能 的 方法 是 使 执行 rm 命令 以 
cd 的 成 功 执行 为 前 提 。 


cd $dir name && rm * 


这 样 以 来 ， 如 果 cd 命令 跳 转 失败 ，rm 命令 就 不 会 执行 。 情 况 有 所 改善 ， 
但 是 仍然 存在 当 dir_name 为 空 的 情况 下 ， 用 户 的 主 目录 被 删除 的 可 能 性 。 检 查 
dir_ name 是否 确 实 包含 有 效 的 目录 名 可 以 避免 此 情形 。 


[[ -d $dir name ]] && cd $dir_name && rm * 
通常 来 说 ， 若 发 生 了 上 述 情形 之 一 ， 最 好 立刻 终止 脚本 的 运行 。 


if [[ -d $dir_ name ]]; then 
if cd $dir name; then 
rm * 
else 
. echo "cannot cd to ‘$dir name’'" >&2 
. exit 1 
fi 
else 
echo "no such directory: '$dir name'" >&2 
exit 1 
fi 


以 上 代码 中 , 不 仅 检查 dir_ name 是 否 包含 有 效 的 目录 名 , 且 验 证 了 cd 命令 
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是 否 跳 转 成 功 。 任 一 验证 没有 通过 的 话 ， 将 对 应 的 描述 性 报错 信息 发 送 给 系统 
标准 错误 ， 且 脚本 终止 运行 ， 其 退出 状态 为 1， 标志 着 运行 失败 。 


30.2.2 ”输入 值 验证 


一 条 普遍 适合 的 编程 法 则 是 若 程序 需 获 得 用 户 输入 ， 则 程序 必须 能 够 处 理 
任何 输入 值 。 这 通常 意味 着 必须 仔细 检查 输入 值 ， 以 保证 有 效 的 输入 可 用 于 进 
一 步 的 处 理 过 程 。 在 29 章 讲 解 read 命令 时 ， 我 们 曾经 遇 到 过 类 似 的 范例 。 某 脚 
本 包含 了 以 下 测试 来 验证 菜单 的 选择 结果 是 否 有 效 。 


[[ $REPLY =~ “[0-3]$ ]] 


这 项 测试 非常 明确 ， 只 有 用 户 返 回 的 字符 串 是 0~3 之 间 的 数字 时 ， 程 序 才 
会 返回 值 为 0 的 退出 状态 ， 除 此 之 外 不 会 接受 任何 其 他 值 。 有 时 输入 值 验证 类 
型 的 测试 写 起 来 很 有 挑战 性 ， 但 却 是 创造 高 质量 脚本 的 必 经 之 路 。 


时 间 雕 琢 而 成 的 设计 

当 我 还 是 一 个 工业 设计 专业 的 大 学 生 时 ， 曾 听 一 位 教授 说 过 : “工程 项 目 
设计 的 质量 等 级 取决 于 给 予 设计 师 的 时 间 长 度 。 若 要 用 五 分 钟 来 设计 一 个 杀 
死 苍 蝇 的 设备 ， 结 果 可 能 是 苍蝇 拍 。 而 给 予 设 计 师 五 个 月 的 话 ， 结 果 就 可 能 
是 激光 制导 的 “ 杀 苑 蝇 系 统 "”. 

这 项 准则 对 编程 同样 适用 。 一 方面 ， 如 果 程 序 员 只 使 用 一 次 脚本 ， 那 么 
一 个 简陋 劣质 的 脚本 就 能 满足 要 求 。 这 种 类 型 的 脚本 很 常见 ， 且 应 开发 得 尽 
量 快 ， 使 得 效益 最 大 化 。 而 另 一 方面 ， 如 果 脚 本 是 用 于 产品 ， 也 就 是 说 脚本 
会 用 于 重要 的 任务 ， 反 复 使 用 或 被 多 个 用 户 使 用 ， 那 么 脚本 的 开发 过 程 就 应 
当 更 加 仔细 小 心 。 


30.3 测试 


对 任何 软件 的 开发 过 程 来 说 ， 包 括 脚本 的 开发 过 程 ， 测 试 都 是 一 个 非常 重 
要 的 步骤 。 在 开源 世界 中 有 这 么 一 种 说 法 一 一 “尽早 发 布 ， 经 常 发 布 ”。 这 种 说 
法 映射 出 了 测试 的 重要 性 。 通 过 尽早 发 布 和 经 常 发 布 新 版 本 ， 软 件 就 能 够 得 到 
更 多 用 户 的 使 用 和 测试 。 经验 表 明 如 果 能 尽早 在 开发 周期 中 发 现 bug, 那么 剩余 
的 bug 会 更 加 容易 发 现 ， 修 补 bug 的 代价 也 会 更 小 。 
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30.3.1 桂 


前 面 讲 到 过 使 用 桩 (stub) 核查 程序 流程 的 内 容 。 从 脚本 开发 的 最 初 阶段 开 
始 ， 桩 就 是 可 用 于 查看 工作 进程 的 重要 技术 手段 。 


现在 让 我 们 回顾 一 下 之 前 的 文件 删除 问题 ， 看 看 怎样 提高 代码 的 易 测试 性 。 
因为 初始 代码 的 目的 是 删除 文件 ， 所 以 对 代码 直接 进行 测试 具有 一 定 的 危险 性 ， 
对 代码 进行 一 些 修改 可 以 解决 这 个 问题 。 
if [[ -d $dir name 1]; then 
if cd $dir name; then 
echo rm * # TESTING 
se echo "cannot cd to 'S$dir name'" >&2 
exit 1 
fi 
else 
echo "no Such directory: 'S$dir name'" >&2 
exit 1 
at # TESTING 


因为 出 现 错误 的 条 件 设置 本 身 已 经 表达 出 了 足够 的 信息 ， 所 以 我 们 就 不 需 
要 再 添加 什么 了 。 最 重要 的 变化 是 在 rm 命令 之 前 放置 了 echo 命令 , 使 得 rm 命 
令 和 扩展 的 命令 参数 可 以 展示 出 来 ， 而 不 是 进行 实际 的 删除 操作 ， 从 而 使 代码 
能 够 安全 地 执行 。 在 代码 片段 的 末尾 ， 我 们 添加 了 exit 命令 来 结束 测试 ， 防 止 
执行 脚本 的 其 他 部 分 。 是 否 需 要 添加 exit 命令 取决 于 不 同 脚本 的 不 同 设计 。 

在 测试 的 过 程 中 ， 我 们 还 需要 添加 一 些 扮演 “记录 者 ”角色 的 注释 ， 来 记 
录 做 出 的 改变 。 在 测试 结束 后 ， 可 根据 注释 还 原 代码 。 


30.3.2 ”测试 用 例 


开发 和 应 用 高 质量 的 测试 用 例 是 执行 测试 过 程 中 的 重要 部 分 。 这 要 求 测试 
人 员 要 很 小 心地 选择 能 反映 边缘 测试 的 输入 数据 和 操作 条 件 。 在 上 述 代码 片段 
《算是 很 简单 的 片段 ， 中 ， 我 们 需要 测试 以 下 三 种 特定 条 件 下 代码 的 执行 情况 。 


。 dir name 包含 的 是 存在 的 目录 名 。 
。 dir_name 包含 的 是 不 存在 的 目录 名 。 
。 dir name 为 空 。 


在 这 三 种 条 件 下 分 别 执行 测试 ， 就 能 够 得 到 较 高 的 测试 覆盖 率 。 


366 ”Linux 命令 行 大 全 


就 像 设计 一 样 ， 测 试 也 是 由 时 间 雕 琢 而 成 。 并 不 是 脚本 的 每 个 角落 都 需要 
测试 ， 要 紧 的 是 确定 什么 是 最 重要 的 。 因 为 出 错 的 代码 可 能 会 造成 席 灭 性 的 后 果 ， 
所 以 不 管 是 代码 设计 还 是 测试 都 需要 程序 员 仔细 地 页 酌 。 


30.4 调试 


如 果 测 试 揭露 出 脚本 存在 问题 , 那么 下 一 步 就 是 调试 “问题 ”通常 意味 着 ， 
在 某 些 情况 下 ， 脚 本 的 运行 结果 和 预期 的 效果 不 同 。 如 果 是 这 样 的 话 ， 就 需要 
仔细 查 明 脚 本 实际 上 是 怎样 运作 的 以 及 为 什么 会 出 现 这 样 的 情况 。 寻 找 bug 有 
时 会 需要 很 多 侦查 工作 。 


设计 优良 的 脚本 本 身 能 够 提供 一 些 帮助 ， 防 御 性 的 脚本 过 到 异常 时 会 向 
用 户 反 馈 有 用 的 信息 。 但 是 ， 解 决 预料 之 外 的 奇怪 问题 就 需要 介入 其 他 的 测 
试 技术 。 


30.4.1 找到 问题 域 


在 一 些 脚本 中 ， 尤 其 是 长 脚本 中 ， 将 问题 相关 的 脚本 域 隔离 出 来 是 很 有 
必要 的 。 隔 离 的 部 分 并 不 一 定 是 实际 问题 所 在 之 处 ， 但 是 通常 能 提供 通 往 实 
际 原因 的 线索 。 其 中 一 种 能 够 用 于 隔离 代码 片段 的 方法 是 “注释 ” 掉 脚 本 的 
一 部 分 。 


if [[ -d $dir name ]]; then 
if cd $dir name; then 
rm * 
else 
echo "cannot cd to 'S$dir name'" >&2 
exit 1 
fi 
# else 
echo “no such directory: ‘$dir name'” >&2 
# exit 1 
fi 


30.4.2 ”追踪 


bug 还 经 常 表现 为 脚本 中 异常 的 逻辑 流程 。 也 就 是 说 , 脚本 的 一 部 分 或 者 从 
来 没有 执行 过 ， 或 者 以 错误 的 顺序 或 在 错误 的 时 间 执 行 了 。 追 踪 是 一 种 用 于 查 
看 程序 实际 运行 流程 的 技术 。 


一 种 追踪 技术 是 通过 在 脚本 中 添加 通知 信息 的 方式 来 展示 程序 执行 之 处 。 
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我 们 可 以 在 上 述 代码 片段 中 添加 一 些 信息 : 


echo “preparing to delete files" >82 
if [[ -d $dir name ]]; then 
if cd $dir name; then 
echo "deleting files" >&2 
窜 


rm 
else 
echo "cannot cd to '$dir_ name' ”>&2 
exit 1 
fi 
else 
echo "no such directory: '$dir name'" >&2 
exit 1 
fi 


echo "file deletion complete" >&2 


我 们 将 这 些 信 息 发 送 给 标准 错误 ， 从 而 与 一 般 的 程序 输出 区 分 开 。 这 些 信 
息 所 在 的 行 没有 缩 进 ， 使 这 些 代码 在 需要 删除 的 时 候 易 于 寻找 。 


在 脚本 执行 之 后 ， 系 统 就 已 经 执行 了 文件 的 删除 操作 。 


[mealinuxbox ~]$ deletion-script 
preparing to delete files 
deleting files 

file deletion complete 
[meelinuxbox ~]$ 


bash 也 提供 了 一 种 追踪 的 方法 ， 即 直接 使 用 -x 选项 或 set 命令 加 -x 选项 。 
在 之 前 的 trouble 脚本 中 ， 在 脚本 第 一 行 添加 -x 选项 即 可 激活 对 整个 脚本 的 追踪 
活动 。 
#1 /bin/bash -x 
# trouble: Script to demonstrate common errors 
number=1 
if [ $number = 1 ]; then 

echo "Number is equal to 1." 

else 


echo “Number is not equal to 1.° 
fi 


脚本 执行 的 结果 如 下 所 示 。 


[me@linuxbox ~]$ trovuble 

+ number=1 

+ T=] 

+ echo 'Number is equal to 1.， 
Number is equal to f. 


激活 追踪 之 后 ， 我 们 就 可 以 看 到 变量 展开 的 执行 情况 。 行 开端 的 加 号 表示 此 
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30.4.3 


行 是 系统 的 追踪 信息 ， 以 区 别 于 一 般 的 输出 。 加 号 是 追踪 信息 的 默认 特征 ， 是 由 
shell 变量 PS4〈 提 示 符 字符 串 4) 设 定 的 ， 用 户 可 以 修改 变量 值 使 追踪 活动 的 提 
示 符 提供 更 多 帮助 信息 。 接 下 来 ， 对 PS4 做 出 修改 ， 使 提示 符 包 含 执行 追踪 活动 
的 脚本 行 号 。 值 得 注意 的 是 ， 单 引号 使 得 提示 符 真 正 被 使 用 时 才 展 开 生 效 。 
[meelinuxbox ~]$ export PS4= '$LINENO + “ 

[meelinuxbox ~]$ trouble 

5 + number=1 

7+ [1=1']' 

8 + echo 'Number is equal to 1.' 

Number is equal to 1. 


要 对 脚本 选 定 的 一 部 分 而 不 是 整个 脚本 执行 追踪 ， 可 以 使 用 set 命令 加 -x 选项 。 
Wbinbasn 
# trouble: script to demonstrate common errors 
number=1 


set -x # Turn on tracing 
if [ $number = 1 ]; then 

echo "Number is equal to 1." 
else 

echo "Number is not equal to 1." 
fi 
Set +x # Turn off tracing 


在 这 里 使 用 set 命令 加 -x 激活 追踪 ，set 命令 加 +x 解除 追踪 。 这 项 技术 可 以 
用 来 检验 一 个 问题 脚本 的 多 个 部 分 。 


运行 过 程 中 变量 的 检验 


在 执行 脚本 并 追踪 脚本 的 过 程 中 ， 显 示 各 变量 的 值 以 体现 脚本 的 内 部 活动 会 
很 有 帮助 。 这 项 功能 通常 通过 添加 额外 的 echo 语句 完成 。 
#1/bin/bash 
# trouble: script to demonstrate common errors 
number=1 


echo "number=$number" # DEBUG 
Set -x # Turn on tracing 
if [ $number = 1 ]; then 

echo "Number is equal to 1." 
else 

echo “Number is not equal to 1.° 
fi ， 
Set +X # Turn off tracing 
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在 这 个 简单 的 例子 中 ， 我 们 只 输出 了 变量 number 的 值 ， 并 使 用 注释 标注 
了 新 行 , 便于 之 后 的 识别 和 删除 。 这 项 技术 在 观察 脚本 中 的 循环 和 计算 行为 时 
尤其 有 用 。 


30.5 ”本 章 结 尾 语 


本 章 讨论 了 脚本 开发 过 程 中 可 能 出 现 的 几 种 问题 。 当 然 ， 没 有 涉及 到 的 问 
题 还 有 很 多 。 本 章 讲述 的 debug 方法 已 经 能 够 帮助 程序 员 找 到 大 多 数 常见 的 
bug。 调 试 是 一 门 在 实践 中 成 长 的 艺术 ， 它 既 包括 避免 bug (在 开发 过 程 中 不 停 
测试 )， 也 包括 找到 bug 〈 有 效 地 利用 追踪 技术 )。 


*31s 


流 控制 : case 分 支 


本 章节 将 继续 讲解 流 控 制 的 内 容 。 第 28 章 构建 了 一 些 简单 的 菜单 ， 并 建立 
了 用 于 响应 用 户 选 择 的 逻辑 。 为 达到 这 个 目的 ， 我 们 使 用 了 一 系列 的 直 命 令 来 
确定 哪个 是 选中 项 ,这 种 类 型 的 程序 构造 经 常 被 用 到 , 所 以 许多 编程 语言 (包括 shell) 
为 基于 多 项 选择 的 判断 提供 了 流 控制 机 制 。 


31.1 case 


bash 的 多 项 选择 复合 命令 被 称 为 case， 其 语法 如 下 所 示 。 
case Word in 


[pattern [| pattern}...) commands ;;]... 
esac 


回顾 第 28 章 中 的 read-menu 程序 ， 可 以 看 到 用 于 响应 用 户 选择 的 逻辑 如 下 所 示 。 
#!/bin/bash 


# read-menu: a menu driven System information program 
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clear 
echo " 
Please Select : 


. Display System Information 
。Display Disk Space 

。 Display Home Space Utilization 
。Quit 


= 品目 间 一 


read -p "Enter Selection [0-3] > " 


if [[ $REPLY =~ “[0-3]$ ]]; then 
if [[ $REPLY == 0 ]]; then 
echo "Program terminated." 
exit 
fi 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 


uptime 
exit 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
exit 
fi 


if [[ S$SREPLY == 3 ]]; then 
if [[ $(id -u) -eq 0 ]]; then 
echo “Home Space Utilization (ALL USers) 
du -sh /home/* 


else 
echo "Home Space Utilization ($USER)" 
du -sh S$HOME 
fi 
exit 
fi 
else 
echo "Invalid entry." >&2 
exit 1 
fi 
使 用 case 可 以 简化 以 上 逻辑 。 


#!/bin/bash 
# case-menu: a menu driven system information program 


clear 
echo " 


Please Select: 

Display System Information 
Display Disk Space 

. Display Home Space Utilization 
Quit 


OWN- 


read -p "Enter selection [0-3] > " 


case $REPLY in 
0) 


1) 


2) 


3) 


*) 


esac 


case 命令 将 关键 字 的 值 一 一 本 例 中 , 即 变 量 REPLY 的 值 一 一 与 特定 的 模式 
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echo "Progran terminated." 
@xit 

33 

echo "Hostname: S$HOSTNAME" 
uptime 

33 


df -h 


La 

if [[ $(id -u) -e9 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 

else 
echo “Home Space Utilization ($USER)” 
du -sh S$HOME 

fi 

35 

echo "Invalid entry" >82 

exit 1 
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相 比 较 ， 才 发 现 吻合 的 模式 ， 就 执行 与 此 模式 相 联 系 的 命令 。 发 现 吻 合 的 模式 
后 ， 将 不 再 比 对 剩余 的 模式 。 


31.1.1 模式 


同 路 径 名 展开 一 样 ，case 使 用 以 “)” 字 符 结尾 的 模式 。 表 31-1 列 出 一 些 


有 效 的 模式 。 


表 31-1 case 模式 范例 


模式 描述 

a) 若 关 键 字 为 a 则 吻合 

{[:alpha:]]) ”车 关 键 字 为 单个 字母 则 吻合 

229) 若 关键 字 为 三 个 字符 则 吻合 

*.txt) 车 关键 字 以 .txt 结尾 则 吻合 

+) 与 任何 关键 字 吻 合 。 在 case 命令 的 最 后 的 一 个 模式 应 用 此 项 是 个 不 错 的 做 法 ， 可 对 应 


所 有 前 模式 不 吻合 的 关键 字 ， 也 就 是 对 应 任何 可 能 的 无 效 什 
下 面 是 一 个 使 用 模式 的 范例 。 


#!/bin/bash 


read -p "enter word > " 


case $REPLY in 


i[:alpha:]]) echo "is a single alphabetic character." ;; 
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[ABC][0-9]) echo "is A, B, or C followed by a digit." ;; 
?7?7?7) echo "is three characters long."” ;; 

*.txt) echo "is a word ending in '.txt'" ;; 

*) echo "is something else." ;; 


esac 


31.1.2 ”多 个 模式 的 组 合 


我 们 也 可 以 使 用 竖 线 作为 分 隔 符 来 组 合 多 个 模式 ， 模 式 之 间 是 “或 ”的 条 
件 关系 。 这 对 一 些 类 似 同 时 处 理 大 写 和 小 写字 母 的 事件 很 有 帮助 。 如 下 所 示 。 


#!/bin/bash 
# case-menu: a menu driven system information program 


clear 
echo " 
Please Select: 


A. Display System Information 

B. Display Disk Space 

€C. Display Home Space Utilization 
Q. Quit 


read -p "Enter selection [A，B，C or Q] > " 
case $REPLY in 


qlo) echo "Program terminated." 
e@xit 
;3 

alA) echo “Hostname : $HOSTNAME 
Uptime 


b|B) df -h 
clc) if [[ $(id -u) -eq 0 ]]; then 


echo "Home Space Utilization (All Users)" 
du -sh /home/* 


else 
echo "Home Space Utilization (S$USER)" 
du -sh $HOME 
fi 
5 
*) echo "Invalid entry" >&2 
exit 1 


3 了 


esac 


以 上 代码 将 case-menu 程序 修改 为 通过 字母 而 不 是 数字 进行 菜单 选择 。 可 以 
注意 到 在 新 模式 下 ， 用 户 进行 选择 时 可 以 输入 大 写字 母 ， 也 可 以 输入 小 写字 母 。 
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31.2 本 章 结 必 语 


case 命令 为 用 户 又 增添 了 一 种 新 的 编程 技巧 。 在 下 一 章 中 我 们 会 看 到 ，case 
是 处 理 特定 类 型 问题 最 好 的 方式 。 


4 


位 置 参 数 


之 前 我 们 一 直 没 有 涉及 程序 接收 和 处 理 命令 行 选项 及 实 参 的 能 力 ， 本 章节 
将 讲解 允许 程序 访问 命令 行内 容 的 shell 功能 。 


32.1 访问 命令 行 
shell 提供 了 一 组 名 为 位 置 参 数 的 变量 ， 用 于 储存 命令 行 中 的 关键 字 ， 这 些 
变量 分 别 命名 为 0~9。 可 以 通过 以 下 方法 展示 这 些 变量 。 
#! /bin/bash 


# posit-param: script to view command line parameters 


echo " 


\$0 = $0 
\$1 = $1 
\$2 = $2 
\$3 = $3 
\$4 = $4 


\$5 = $5 
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\$6 = $6 
\$7 = $7 
\$8 = $8 


\$9 = $9 


这 个 简单 的 脚本 展示 了 从 变量 $0 到 变量 $9 的 值 。 在 没有 任何 命令 行 实 参 的 
情形 下 执行 此 脚本 结果 如 下 所 示 。 
[me@linuxbox ~]$ posit-param 


$0 = /home/me/bin/posit-param 


ig 
a 
和 


即便 没有 提供 任何 实 参 ， 变 量 $0 总 是 会 储存 有 命令 行 显示 的 第 一 项 数据 ， 也 就 
是 所 执行 程序 所 在 的 路 径 名 。 现 在 让 我 们 ， 看 一 下 提供 实 参 情 形 下 的 程序 执行 结果 : 
Tmeelinuxbox -]$ posit-paran abcd OO 
/home/me/bin/posit-param 
b 


c 


$4 = d 


$9 = 


使 用 参数 扩展 技术 ， 用 户 实际 可 以 获取 多 于 9 个 的 参数 。 为 标明 一 个 大 于 
9 的 数字 ， 将 数字 用 大 括号 括 起 来 ， 例 如 ${10}、${55} 和 $1{211} 等 。 


32.1.1 确定 实 参 的 数目 


shell 还 提供 了 变量 $# 以 给 出 命令 行 参数 的 数目 。 
#1 /bin/bash 
# posit-param: script to view command line parameters 


echo " 
Number of arguments: $# 
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\$0 = $0 
\$1 = $1 
\$2 = $2 
\$3 = $3 
\$4 = $4 
\$5 = $5 
\$6 = $6 
\$7 = $7 
\$8 = $8 
\$9 = $9 
以 上 程序 运行 结果 如 下 所 示 。 


[me@linuxbox ~]$ posit-param a b cd 


Number of arguments: 4 
/home/me/bin/posit-param 
a 


:24 
[=3 
1 


b 
C 
d 


:54 
a 
LL 


32.1.2 。 shift 一 一 处 理 大 量 的 实 参 
但 是 如 果 给 程序 提供 大 量 的 实 参 会 发 生 什么 呢 ? 如 下 所 示 。 
[me@linuxbox ~]$ posit-param * 


Number of arguments: 82 


$0 = /home/me/bin/posit-param 

$1 = addresses.1dif 

$2 = bin 

$3 = bookmarks.html 

$4 = debian-500-i386-netinst.iso 

$5 = debian-500-i386-netinst.jigdo 

$6 = debian-500-i386-netinst.template 
$7 = debian-cd_info.tar.gz 

$8 = Desktop 

$9 = dirlist-bin.txt 


在 本 示例 系统 中 ， 通 配 符 “*” 扩 展 为 82 个 实 参 。 怎 样 才能 处 理 这 么 多 的 
实 参 呢 ? shell 提供 了 一 种 略 显 笨拙 的 处 理 方法 。 每 次 执行 shift 命令 后 ， 所 有 参 
数 的 值 均 “ 下 移 一 位 ”。 实 际 上 ， 通 过 shift 命令 我 们 就 可 以 只 处 理 一 个 参数 〈$0 
之 外 的 一 个 参数 ，$0 值 恒 定 ) 而 完成 全 部 程序 任务 。 
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0 
#1/bin/bash . 


# posit-param2: script to display all arguments 
count=1 
while [[ $# -gt 0 ]]; do 

echo "Argument $count = $1" 

count=${ (count + 1)) 


shift 
done 


每 当 执 行 一 次 shif 命令 时 , 变量 $2 的 值 就 赋 给 变量 $1, 而 $3 的 值 则 赋 给 变 
量 $2， 依 次 类 推 。 变 量 $# 的 值 同 时 减 1。 

在 程序 posit-param2 中 ， 我 们 创建 了 一 个 循环 ， 只 要 还 存在 1 个 实 参 , 循环 
就 不 停止 。 首 先 输出 当前 的 实 参 ， 其 次 ， 每 当 循环 迭代 一 次 ， 就 将 变量 count 值 加 
1， 代 表 处 理 过 的 实 参数 目 。 最 后 ， 执 行 shift 命令 使 $1 载 入 下 一 个 实 参 的 值 。 
以 下 是 posit-param2 的 运行 范例 。 

[me@linuxbox ~]$ posit-paran2 a bc 二 
Argument 1 = a 
Argument 2 = b 
Argument 3 = C 
Argument 4 = d 


32.1.3 ”简单 的 应 用 程序 


不 使 用 shiR， 我 们 也 可 以 写 出 使 用 位 置 参数 的 有 用 的 应 用 程序 。 下 面 是 一 
个 简单 的 文件 信息 程序 范例 。 
#1/bin/bash 
# file_info: simple file information program 
PROGNANME=$ (basename $0) 
if [[ -e $1 ]]; then 


echo -e "\nFile Type:" 
file $1 


echo -e "\nFile Status:" 
stat $1 
else 
echo “$PROGNAME : usage: $PROGNAME file" >&2 
exit 1 
fi 


这 个 程序 输出 了 单个 特定 文件 的 文件 类 型 (来 自 file 命令 ) 和 文件 状态 (来 
自 stat 命令 )。 程 序 中 的 PROGRAME 变量 是 一 个 有 趣 的 角色 ， 其 值 来 自 basename 
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$0 命令 的 执行 结果 。basename 命令 的 作用 是 移 除 路 径 名 的 起 始 部 分 ， 只 留 下 基 
本 的 文件 名 。 在 上 述 例子 中 ，basename 移 除 了 $0 参数 中 范例 程序 所 在 路 径 全 名 
的 起 始 部 分 ， 得 到 的 值 在 构建 程序 信息 一 一 如 程序 末尾 的 使 用 信息 一 一 时 很 有 
用 处 。 若 使 用 basename 构建 信息 ， 在 重 命名 脚本 后 ， 这 条 信息 会 自动 调整 所 包 
含 的 程序 名 称 。 


”32.1.4 在 shell 函数 中 使 用 位 置 参数 


32.2 


就 像 位 置 参数 可 用 于 向 shell 脚本 传递 实 参 一 样 ， 位 置 参 数 也 可 用 于 shell 
函数 实 参 的 传递 。 现 在 将 file_info 脚本 改写 为 shell 函数 ， 以 进行 如 下 演示 说 明 。 


file_info () { 
# file info: function to display file information 


if [I[ -e $1 ]]; then 
echo -e "\nFile Type: 
file $1 
echo -e "\nFile Status:" 
stat $1 
else 
echo "$FUNCNAME: usage: $FUNCNAME file" >&2 
return 1 
fi 


现在 ， 如 果 一 个 包含 了 file_info 函数 的 脚本 以 一 个 文件 名 为 实 参 调用 fle_ 
info， 则 此 实 参 就 被 传递 给 file_info 函数 。 


在 这 样 的 条 件 下 ， 我 们 就 可 以 写 出 很 多 不 仅 普通 脚本 可 使 用 ， 而 且 .bashrc 
文件 也 适用 的 有 用 的 shell 函数 。 


需要 注意 的 是 ， PROGRAME 变量 被 换 成 了 名 为 FUNCNAME 的 shell 变量 。 
shell 自动 更 新 FUNCNAME 以 追踪 当前 执行 的 shell 函数 。 但 是 变量 $0 包含 的 
总 是 命令 行 第 一 项 的 路 径 全 名 《〈 例 如， 程序 名 称 )， 而 并 不 像 用 户 可 能 期 待 的 那 
样 包 含 了 shell 函数 的 名 称 。 


处 理 多 个 位 置 参数 


有 时 我 们 将 所 有 的 位 置 参 数 作为 一 个 整体 来 处 理会 比较 方便 。 例 如 ， 为 目 
标 程序 写 一 个 包装 ， 也 就 是 编号 一 个 简化 了 目标 程序 运作 过 程 的 脚本 或 者 
shell 函数 的 时 候 ， 包 装 就 供应 了 一 系列 的 复杂 的 命令 行 选 项 ， 并 为 下 一 层 的 程 
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序 传递 所 需 的 实 参 。 


shell 为 这 项 功能 提供 了 两 种 特殊 的 参数 。 两 种 参数 都 能 够 扩展 为 一 个 完整 
的 位 置 参 数列 ， 但 是 又 有 着 微妙 的 区 别 。 表 32-1 描述 了 这 两 种 参数 。 


表 32-1 特殊 的 参数 * 和 @ 
参数 ”描述 


可 扩展 为 从 1 开始 的 位 置 参 数列 。 当 包括 在 双 引 号 内 时 ， 扩 展 为 双 引 号 引用 的 由 全 部 位 置 
$* 参数 构成 的 字符 串 ， 每 个 位 置 参数 以 IFS shell 变量 的 第 一 个 字符 默认 情况 下 为 空格 ) 间 
隔 开 


s@ 可 扩展 为 从 1 开始 的 位 置 参数 列 。 当 包括 在 双 引 号 内 时 ， 将 每 个 位 置 参 数 扩展 为 双 引 号 引 
用 的 单独 单词 


下 面 的 脚本 演示 了 这 两 种 特殊 的 参数 功能 。 


#1 /bin/bash 


# posit-params3 : Script to demonstrate $* and $@ 


print params () { 
echo "\$1 = $1" 
echo "\$2 = $2" 
echo "\$3 = $3" 
echo "\$4 = $4" 


pass_params () { 
echo -e "\n" '$ :'; print params $* 
echo -e "\n" '"$*" :;'; print params “$+*" 
echo -e "“\n" '$@ :'; print params $@ 
echo -e "\n" '"$@" :'; print params "$@" 
} 


pass_params "word" "words with spaces" 


在 这 个 较为 复杂 的 程序 中 ， 我 们 创建 了 两 个 实 参 一 一 word 和 words with spaces， 
并 将 其 传递 给 pass_params 函数 。 而 pass_params 函数 使 用 4 种 “$*” 和 “$@” 
的 方法 , 将 这 两 个 实 参 分 别 依次 传递 给 print_params 函数 。 脚 本 执行 的 结果 反映 
了 它们 之 间 的 区 别 。 


[me@linuxbox ~]$ posit-param3 


$* : 

$1 = word 

$2 = words 

$3 = with 

$4 = spaces 

"Bt" : 

$1 = word words with spaces 
$2= 


$3 = 
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$1 = word 
$2 = words 
$3 = with 
$4 = spaces 


@" 
$1 = word 
$2 = words with spaces 
$4 = 

对 word 和 words with spaces 两 个 实 参 ,“$*” 和 “$@” 都 产生 了 包含 4 个 
单词 的 结果 ， 即 word、words、with 和 spaces。“$*+ ”产生 的 是 只 包含 一 条 字符 串 
的 结果 ， 即 word words with spaces。“$@” 产 生 的 则 是 包含 了 两 条 字符 串 的 结果 ， 
即 word 和 words with spaces。 

结果 与 实际 期 望 相符 。 从 中 我 们 得 到 的 结论 就 是 尽管 shell 提供 了 四 种 不 同 
的 获得 位 置 参 数列 的 方法 ， 因 为 “$@ ”保持 了 每 个 位 置 参数 的 完整 性 ， 所 以 迄 
今 为 止 ,“$@” 是 大 多 数 情况 下 最 令 人 满意 的 方法 。 


32.3 ”更 完整 的 应 用 程序 


在 很 长 的 间隔 之 后 ， 现 在 我 们 重新 回 到 sys_info_page 程序 的 工作 上 来 。 接 
下 来 我 们 将 为 程序 添加 如 下 所 示 的 命令 行 选 项 。 

。 输出 文件 。 指 定 程序 输出 文件 的 选项 。 使 用 形式 是 -f file 或 者 - -file file。 

。 交互 模式 。 这 个 选项 会 提示 用 户 输 出 文件 的 名 称 ， 并 检验 此 文件 是 否 已 经 
存在 。 若 文件 已 经 存在 ， 在 覆盖 文件 之 前 提示 用 户 。 使 用 形式 是 -i 或 者 - 
-interactive。 

。 帮助 。 形 式 为 -h 或 者 - -help， 可 使 程序 输出 帮助 性 质 的 使 用 说 明 。 

下 面 是 完善 命令 行 处 理 功能 所 需 的 代码 。 


usage () { 
echo "$PROGNAME: usage: $PROGNAME [-f file | -i]" 
return 


} 
# process command line options 


interactive= 
filename= 
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while [[ -n $1 1]; do 


case $1 in 
-f | --file) shift 
filename=$1 
23 
-i | --interactive) interactive=1 
Hp 
-h | --help) usage 
exit 
13 
*) usage >&2 
exit 1 
esac 
shift 


done 

首先 ， 我 们 添加 名 为 usage 的 shell 函数 ， 在 使 用 help 选项 或 者 未 知 选 项 时 ， 
usage 会 输出 相应 的 提示 信息 。 

接 下 来 ， 我 们 将 处 理 过 程 循环 启动 。 只 要 位 置 参 数 $1 不 为 空 ， 循 环 不 停 。 
在 循环 的 末尾 ， 使 用 shift 命令 推进 位 置 参 数 处 理 进程 ， 确 保 不 是 死 循 环 。 

在 循环 中 ， 我 们 使 用 case 语句 来 检验 当前 位 置 参 数 是 否 与 任何 程序 支持 的 
选项 相 匹 配 。 若 发 现 支 持 的 参数 选项 ， 则 基于 参数 做 出 相应 的 行为 。 若 没有 发 
现 匹 配 项 ， 则 输出 程序 使 用 信息 ， 脚 本 以 error 结束 运行 。 

程序 中 -f 参 数 的 处 理 过 程 很 有 趣 。 在 检测 到 -f 后 ， 即 执行 附加 的 shift 命令 ， 
使 位 置 参 数 $1 的 内 容 置 换 为 -了 选项 后 的 文件 名 实 参 。 


下 一 步 我 们 将 添加 完善 交互 模式 所 需 的 代码 。 
# interactive mode 


if [[ -n $interactive ]]}; then 
while true; do 
read -p "Enter name of output file: * filename 
if [[ -e $filename ]]; then 
read -p "'$filename' exists, Overwrite? [y/n/q] > * 
case $REPLY in 


Yly) break 
sy 
Qlq) echo "Program terminated." 
e@xit 
13 
*) continue 
;3 
esac 
elif [[ -z $filename ]]; then 
continue 


else 
break 
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fi 
done 


车 interactive 变量 不 为 空 , 则 开启 一 个 无 限 循 环 , 循环 中 包含 了 文件 名 提示 
符 和 接 下 来 的 当前 存在 的 文件 处 理 代码 。 若 设想 的 输出 文件 已 经 存在 ， 则 提示 
用 户 覆 盖 文 件 。 另 选 文件 或 者 退出 程序 。 若 用 户 选择 覆盖 当前 存在 的 文件 ， 则 
使 用 break 跳出 循环 。 需要 注意 的 是 ， 只 有 在 用 户 选择 覆盖 当前 存在 的 文件 或 退 
出 程序 的 时 候 ，case 语句 才 适 用 。 任 何其 他 的 选择 都 会 使 循环 继续 运行 并 再 次 
提示 用 户 。 

为 了 完善 程序 指定 输出 文件 名 的 功能 ， 我 们 必须 首先 将 现存 的 写 页 面 的 代 
码 改 写 为 shell 函数 ， 这 样 做 的 原因 马上 就 会 揭晓 。 


write html page () { 
cat <<- _EOF_ 
<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
$(report uptime) 
$(report_disk_space) 
$(report_home_space) 
</BODY> 
</HTNML> 
_EOF_ 
return 


} 
# output html page 
if [[ -n $filename ]]; then 


if touch $filename && [{ -f $filename ]]; then 
write html page > $filename 


else 
echo "S$PROGNANE: Cannot write file '$filename'" >&2 
e@xit 1 
fi 
else 
write html_ page 
fi 


处 理 -f 选项 的 逻辑 出 现在 上 述 代 码 的 底部 。 在 逻辑 中 ， 首 先 检验 文件 是 否 
存在 ,车 存在 ， 则 检验 文件 是 否 确实 可 写 。 为 达到 这 样 的 目的 ,执行 touch 命令 
并 检验 结果 文件 是 否 是 常规 文件 。 这 两 项 检验 考虑 到 了 在 输入 的 是 无 效 路 径 
(touch 会 执行 失败 ) 和 文件 已 存在 的 情况 下 ， 文 件 是 否 是 常规 文件 。 
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可 以 看 到 ， 在 实际 生成 页 面 的 执行 过 程 中 调用 了 write_html_page 函数 ， 
并 将 函数 的 输出 定向 到 标准 输出 (filename 变量 为 空 时 ) 或 重 定向 到 指定 的 
文件 。 


32.4 本章 结尾 语 


在 位 置 参数 的 帮助 下 ， 用 户 可 写 出 功能 性 更 强 的 脚本 。 简 单 来 说 ， 对 于 重 
复 性 的 任务 ， 位 置 参数 使 得 用 户 可 以 写 出 很 有 帮助 的 shell 函数 ， 并 放置 在 用 户 
的 .bashrc 文件 中 。 


sys_info_page 程序 在 复杂 性 和 先进 性 方面 有 了 很 大 提升 。 下 面 是 完整 的 程 
序 ， 并 突出 显示 了 最 近 做 出 的 改变 。 


#1/bin/bash 


# sys_info page: program to output a System information page 


PROGNAME=$ (basename $0) 

TITLE="System Information Report For $HOSTNAME" 
CURRENT_TIME=$ (date +"%x %r %2") 
TIME_STAMP="Generated $CURRENT _ TINME, by $USER" 


report_ uptime {) { 


cat <<- EOF_ 
<H2>System Uptime</H2> 
<PRE>$ (uptime)</PRE> 
_EOF_ 

return 


report disk space () { 
cat <<- _EOF_ 
<H2>Disk Space Utilization</H2> 
<PRE>$ (df -h)</PRE> 
_EOF_ 
return 
} 
report_home space {) { 
if [[ $(id -u) -eq 0 ]]; then 
cat <<- EOF_ 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$(du -sh /home/*)</PRE> - 


_EOF_ 
else 
cat <<- EOF_ 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$(du -sh $HOME)</PRE> 
_EOF_ 
fi 
return 
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usage () { 
echo "S$PROGNAME: usage: SPROGNAME [-f file | -i]" 
return 


} 
write html page () { 


cat <<- EOF_ 
<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP< / P> 
$(report_uptime) 
$(report disk space) 
$(report_home space) 
</BODY> 
</HTHNL> 
_EOF_ 
return 
} 
# process command line options 
interactive= 
filename= 


while [[ -n $1 ]]; do 


case $1 in 
-ff | --file) shift 
filename=$1 
3 
-i | --interactive) interactive=1 
39 
-h | --help) usage 
exit 
;35 
*}) usage >&2 
exit 1 
;35 
esac 
shift 


done 
# interactive mode 


if f[ -n $interactive ]}; then 
while true; do 
read -p "Enter name of output file: " filenanme 
if [[ -e $filename ]]; then 
read -p “'S$filename' exists. Overwrite? [y/n/q] >“ 
case $REPLY jin 


Yly) break 
33 

aiq) echo "Program terminated 
exit 


33 
*) continue 
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esac 
fi 
done 
fi 


# output html page 
if [[ -nm $filenane ]]; then 


zf touch $filename 8&8 [[ -f $filename ]]; then 
write html page > $filename 


else 
echo "$PROGNAME:; Cannot write file '$filename'" >&2 
exit 1 : 
fi 
else 
write_html_page 
fi 


现在 这 个 脚本 已 经 很 不 错 了 ， 但 是 还 没有 结束 。 在 下 一 章 中 ， 
脚本 做 出 最 后 的 改进 。 


*33。 


流 控 制 : for 循环 


本 章 是 关于 流 控制 的 最 后 一 章 ， 我 们 将 会 再 学 习 一 个 新 的 shell 循环 结构 。 
因为 for 循环 采用 在 循环 期 间 进行 序列 处 理 的 机 制 ， 所 以 它 不 同 于 while 循环 和 
until 循环 。 事 实证 明 ， 这 在 编程 时 是 非常 有 用 的 。 因 此 ，for 循环 在 bash 脚本 
编程 中 是 一 种 十 分 流行 的 结构 。 

自然 地 ， 实 现 一 个 for 循环 应 使 用 for 命令 。 在 新 版 bash 语言 中 ，for 命令 
存在 两 种 形式 。 


“33.1 for: 传统 shell 形式 
原始 的 for 命令 语法 如 下 。 


for variable [in words]; do 
commands 
done 


其 中 ，variable 是 一 个 在 循环 执行 时 会 增值 的 变量 名 ，words 是 一 列 将 按 顺 
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. 序 赋 给 变量 variable 的 可 选项 ，commands 部 分 是 每 次 循环 时 都 会 执行 的 命令 。 
for 命令 在 命令 行 上 是 很 有 用 的 。 很 容易 就 可 以 获知 它 的 工作 方式 。 


[me@linuxbox ~]$ for i in A BC D; do echo $i; done 


Rm 


在 本 例 中 ，for 顺序 执行 了 一 个 包含 4 个 字符 的 列表 : A、B、C 和 D。 它 采用 
包含 4 个 字符 的 列表 ， 循 环 执行 了 4 次 。 在 循环 体内 部 echo 命令 显示 变量 i 的 值 ， 
以 此 表明 赋值 过 程 。 像 while 循环 和 until 循环 一 样 ，for 循环 以 关键 词 done 结束 。 

for 循环 真正 强大 的 功能 在 于 创建 字符 列表 的 方式 有 多 种 。 例 如 ， 可 以 使 用 
花 插 号 扩展 方式 ， 如 下 所 示 。 


[meelinuxbox ~]$ for i in {A..D}; do echo $ done 


号 Om 


或 使 用 路 径 名 扩展 方式 ， 如 下 所 示 。 


[meelinuxbox ~]$ for i in distros* .txt; do echo $i; done 
distros-by-date .txt 

distros-dates.txt 

distros-key-names.txt 

distros-key-vernums .txt 

distros-names.txt 

distros.txt 

distros-vernums .txt 

distros-versions .txt 


再 或 者 使 用 命令 形式 ， 如 下 所 示 。 


#!/bin/bash 
# longest-word : find longest string in a file 


while [{ -n $1 ]]; do 
if [[ -r $1 ]]; then 
max_word= 
max_len=0 
for i in $(strings $1); do 
len=$(echo $i | we -c) 
if (( len >.max_len )); then 
max_len=$1len 
max_word=$i 
fi 
done 
echo "$1: '$max_ word' ($max_len characters) 
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fi 
shift 
done 


. 本 例 的 功能 是 在 一 个 文件 中 搜索 最 长 的 字符 串 。 当 在 命令 行 输入 一 个 或 多 
个 文件 名 时 ， 本 程序 调用 strings 程序 (包含 在 GNU binutils 软件 包 里 ) 并 在 每 
个 文件 中 产生 一 个 可 读 文本 “字符 ” for 循环 按 顺 序 处 理 每 个 字符 ， 判 断 目前 
的 字符 是 不 是 迄今 为 止 找 到 的 最 长 字符 。 当 循环 终止 ， 将 会 打印 出 最 长 的 字符 。 
最 后 的 字符 将 被 打印 出 来 。 


如 果 for 命令 中 字符 部 分 的 选项 被 忽略 ，for 循环 默认 处 理 该 位 置 参数 。 我 
们 可 以 使 用 如 下 方法 ， 修 改 longest-word 脚本 。 


#ity/bin/bash 


# longest-word2 : find longest string in a file 


for i; do 
if [[ -r $i ]]; then 
max_word= 
max_len=0 
for j in $(strings $i); do 
len=$(echo $j | wc -c) 
if (( len > max_len )); then 
max_len=$1len 
max_word=$j 
fi 
done 
echo “$i: '$max word' ($max_len characters)" 
fi 
done 


如 上 上 所 示 ， 最 外 层 循环 发 生 了 改变 ， 使 用 for 代替 了 while。 因 为 for 命令 
中 语句 列表 采用 默认 值 ， 所 以 使 用 位 置 参数 。 在 循环 内 部 ,前 例 的 变量 i 已 经 被 
变换 成 变量 j， 并 且 shift 也 已 弃 之 不 用 。 


为 什么 变量 名 是 1? 

你 一 定 已 经 注意 到 以 上 每 一 个 for 循环 中 都 选择 使 用 变量 i。 这 是 为 什么 
呢 ? 其 实 ， 除了 惯例 这 个 理由 之 外 ， 没 有 其 他 原因 。for 循环 使 用 的 变量 可 以 
是 任何 有 效 变量 ， 不 过 i 是 最 常见 的 ， 除 此 之 外 还 有 j 和 k。 

这 种 惯例 来 自 于 Fortran 编程 语言 。 在 Fortran 语言 中 ， 以 字母 I、J、K、L 和 
M 开头 的 未 声明 的 变量 自动 被 归 类 为 整数 ， 而 以 其 他 字母 开头 的 变量 被 归 类 为 实 
数 ( 含 十 进 制 小 数 的 数字 )。 因 为 当 需 要 一 个 临时 变量 时 (循环 通常 如 此 )， 这 样 
做 会 比较 省 力 ， 所 以 这 种 方式 促使 程序 员 使 用 变量 I、J 和 到 作为 循环 的 变量 。 

为 此 也 诞生 了 这 样 的 Fortran 双关 语 : “GOD 是 真 的 〔 实 数 )， 除 非 被 声 
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明 为 整数 .”( 译 者 注 : GOD is real, unless declared integer GOD 双关 “变量 
GOD?” 或 者 “上 党”， real 双关 “ 真 的 ” 或 者 “实数 ) 


33.2 for: C 语言 形式 


最 近 的 bash 版 本 已 经 加 入 了 第 二 种 for 命令 语法 ， 它 类 似 于 C 语言 形式 ， 
并 且 许 多 其 他 编程 语言 都 支持 这 种 形式 。 


for (( expressioni; expression2; expression3 )); do 
commands 
done 


其 中 expression 1、expression 2 和 expression 3 为 算术 表达 式 ，commands 
是 每 次 循环 都 要 执行 的 命令 。 
就 执行 结果 而 言 ， 这 种 形式 等 同 于 如 下 结构 。 
(( expressiony )) 
while (( expression2 )); do 
commands 


(( expression3 )) 
Done 


expressionl 用 来 初始 化 循环 条 件 ，expression2 用 来 决定 循环 何 时 结束 ， 
expression3 在 每 次 循环 末尾 执行 。- 
这 里 有 一 个 典型 的 应 用 。 
#1/bin/bash 
# simple_counter : demo of C style for command 
for (( i=0; i<5; i=i+1 )); do 


echo $i 
done 


执行 后 ， 它 将 输出 如 下 结果 。 


me@linuxbox ~]$ siwple_counter 


[ 
0 
1 
2 
3 
4 


本 例 中 ,expressionl 对 变量 i 初始 化 赋值 为 0, 只 要 i 的 值 小 于 $,expression2 
就 允许 循环 继续 ，expression3 在 每 次 循环 重复 时 使 i 的 值 增加 1。 
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每 当 需 要 数值 序列 时 ,for 的 C 语言 形式 就 能 发 挥 作用 了 。 接 下 来 的 两 章 将 
学 习 这 种 情况 下 的 几 个 实际 应 用 。 


33.3 “本章 结 尾 语 


学 习 了 for 命令 之 后 ， 我 们 将 最 后 的 改进 应 用 到 sys_info_page 脚本 中 。 目 前 ， 
report_home ”space 函数 应 该 是 这 样 。 


report_ home space () { 
if [{ $(id -u) -eq 0 ]]; then 
cat <<- _EOF_ 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$ (du -sh /home/*)</PRE> 


_EOF_ 
else 
cat <<- _EOF_ 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$ (du -sh S$HOME)</PRE> 
_EOF_ 
fi 
return 


接 下 来 ， 我 们 将 重 写 上 述 脚 本 ， 使 其 可 以 为 每 个 用 户 的 主 目录 提供 更 多 的 
细节 ， 并 且 包 会 每 个 用 户 的 文件 总 数 和 子 目 录 总 数 。 


report_home_space () { 


local format="%8s%10s%10s\n" 
local i dir list total files total dirs total size user name 


if [[ $(id -u) -eq 0 1]; then 
dir list=/home/* 
user_name="All Users 

else 
dir_list=$HOME 
user_name=$USER 

fi 


echo "<H2>Home Space Utilization ($user _ name)</H2>" 
for i in $dir list; do 


total files=$ (find $i -type 下 | we -1) 

total dirs=$(find $i -type d | wc -1) 

total_size=$(du -sh $i | cut -f 1) 

echo "<H3>$i</H3>" 

echo "<PRE>" 

printf "$format" "Dirs" "Files" "Size" 

printf “$format" "----" "----- "2" 

printf "$format" S$total dirs $total files $total size 
echo "</PRE>" 
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done 
return 


} -一 
这 次 重 写 应 用 了 很 多 目前 为 止 学 习 过 的 知识 。 虽 然 仍 要 求 超级 用 户 运行 ， 


但 是 设置 了 一 些 随 后 在 一 个 for 循环 中 用 到 的 变量 ， 而 不 是 运行 一 整套 作为 证 
语句 部 分 的 程序 。 此 外 ,在 函数 中 我 们 加 入 了 几 个 局 部 变量 ， 并 利用 printf 按 格 


式 输出 内 容 。 


*34s 


字符 串 和 数字 


计算 机 程序 其 实 就 是 处 理 数据 。 前 面 的 章节 主要 从 文件 层面 讲解 了 数据 的 
处 理 。 然 而 ， 很 多 编程 问题 需要 用 到 更 小 的 数据 单元 ， 例 如 字符 串 和 数字 ， 来 
解决 。 

本 章 将 学 习 几 个 用 于 操纵 字符 串 和 数字 的 shell 脚本 特性 。shell 提供 了 多 种 
字符 串 操作 的 参数 扩展 。 除了 算术 扩展 〈 在 第 7 章 讲 到 )， 还 有 一 个 常见 的 名 为 
bc 的 命令 行程 序 ， 它 能 执行 更 高 层次 的 数学 运算 。 


34.1 参数 扩展 (Parameter Expansion ) 


虽然 参数 扩展 在 第 7 章 就 已 出 现 ， 但 是 因为 大 部 分 参数 扩展 使 用 在 脚本 文 
件 ， 而 非 命令 行 中 ， 所 以 我 们 未 加 详细 解释 ， 在 这 之 前 已 经 使 用 了 某 些 形式 的 
参数 扩展 ， 例 如 shell 变量 。shell 提供 了 多 种 参数 的 扩展 形式 。 
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34.1.1 基本 参数 


参数 扩展 的 最 简单 形式 体现 在 平常 对 变量 的 使 用 中 。 举 例 来 说 ，$a 扩展 后 
成 为 变量 a 所 包含 的 内 容 ， 无 论 a 包含 什么 。 简 单 参数 也 可 以 被 括号 包围 ， 例 
如 ${aj。 这 对 扩展 本 身 毫 无 影响 ， 但 是 ， 当 变量 相 邻 于 其 他 文本 时 ， 则 必须 使 
用 括号 ， 否 则 可 能 让 shell 混淆 。 看 下 面 这 个 例子 ， 我 们 试图 以 附加 字符 串 _fie 
到 变量 .a 内 容 后 的 方式 新 建 一 个 文件 名 。 


[me@linuxbox ~]$ a="foo" 
[me@linuxbox ~]$ echo "$a_file" 


由 于 shell 会 试图 扩展 名 为 a_file 的 变量 而 不 是 a 变量 ， 所 以 如 果 按 序 执行 
这 些 命令 ， 结 果 将 是 一 无 所 获 。 这 个 问题 可 以 通过 加 上 括号 加 以 解决 。 


[meelinuxbox ~]$ echo "${a}_file" 
foo file 


同样 可 见 ， 大 于 9 的 位 置 参数 可 以 通过 给 相应 数字 加 上 括号 来 访问 。 例 如 ， 
访问 第 11 个 位 置 参数 ， 可 以 这 样 做 一 一 ${11}。 


34.1.2” 空 变量 扩展 的 管理 


有 的 参数 扩展 用 于 处 理 不 存在 的 变量 和 空 变 量 。 这 些 参数 扩展 在 处 理 缺 失 
的 位 置 参数 和 给 参数 赋 默 认 值 时 很 有 用 处 。 这 种 参数 扩展 形式 如 下 。 


${parameter: -word} 


如 果 parameter 未 被 设 定 〈 比 如 不 存在 ) 或 者 是 空 参数 ， 则 其 扩展 为 word 
的 值 ， 如 果 parameter 非 空 ， 则 扩展 为 parameter 的 值 。 


[me@linuxbox ~]$ foo= 

[me@linuxbox ~]$ echo ${fo0o:-"substitute value if unset"} 
substitute value if unset 

[meelinuxbox ~]$ echo $foo 

[me@linuxbox ~]$ foo=bar 


[me@linuxbox ~]$ echo ${fo0:-"substitute Value if unset"} 
bar 


[me@linuxbox ~]$ echo $foo 
Bar 


以 下 是 另 一 种 扩展 形式 ， 在 里 面 使 用 等 号 ， 而 非 连 字符 号 。 


${parameter:=word} 


如 果 parameter 未 被 设 定 或 者 为 室 ， 则 其 扩展 为 word 的 值 ， 此 外 ，word 的 
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值 也 将 赋 给 parameter。 如 果 parameter 非 空 ， 则 扩展 为 parameter 的 值 。 


[me@iinuxbox -]$ foo= 

[meelinuxbox ~]$ echo ${foo:="default value if unset"} 
default value if unset 

[me@liinuxbox ~]$ echo $foo 

default value if unset 

[meelinuxbox ~]$ foo=bar 

[meelinuxbox ~]$ echo ${foo:="default value if unset"} 
bar 

[meelinuxbox ~]$ echo $foo 

Bar 


注意 位 置 参 数 和 其 他 特殊 参数 不 能 以 这 种 方式 赋值 。 


我 们 使 用 一 个 问号 ， 如 下 所 示 。 
${parameter: ?word} 


如 果 parameter 未 设 定 或 为 空 ， 这 样 扩展 会 致使 脚本 出 错 而 退出 ， 并 且 word 
内 容 输 出 到 标准 错误 。 如 果 parameter 非 空 ， 则 扩展 结果 为 parameter 的 值 。 


{me@linuxbox ~]$ foo= 

[me@linuxbox -]$ echo ${foo0o:?"parameter is empty"} 
bash: foo: parameter is empty 

[me@iinuxbox ~]$ echo $2? 

1 

[me@linuxbox ~]$ foo=bar 

[me@linuxbox ~]$ echo ${fo0:?"parameter is empty"} 
bar 

[me@linuxbox ~]$ echo $? 

0 


如 果 我 们 使 用 一 个 加 号 ， 如 下 所 示 : 


${parameter :+word} 


车 parameter 未 设 定 或 为 空 ， 将 不 产生 任何 扩展 。 若 parameter 非 空 ，word 
的 值 将 取代 parameter 的 值 ， 然 而 ，parameter 的 值 并 不 发 生变 化 。 


[me@linuxbox ~]$ foo= 
[me@linuxbox -]$ echo ${foo:+"substitute value if set"} 


[me@linuxbox ~]$ foo=bar 
[meelinuxbox ~]$ echo ${foo:+"substitute value if set"} 
substitute value if set 


34.1.3 ”返回 变量 名 的 扩展 
shell 具有 返回 变量 名 的 功能 。 这 种 功能 在 相当 特殊 的 情况 下 才 会 被 用 到 。 
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${iprefix*} 
${iprefix@} 


该 扩展 返回 当前 以 prefix 开头 的 变量 名 。 根 据 bash 文档 ， 这 两 种 扩展 形式 
执行 效果 一 模 一 样 。 下 面 的 例子 中 ， 我 们 列 出 了 环境 变量 中 所 有 以 BASH 开头 
的 变量 。 

[me@linuxbox ~]$ echo ${!1BASH*} 


BASH BASH_ARGC BASH_ARGV BASH COMMAND BASH_COMPLETION BASH_COMPLETION_DIR 
BASH_LINENO BASH_SOURCE BASH_SUBSHELL BASH_VERSINFO BASH_VERSION 


34.1.4 ”字符 串 操作 


对 字符 串 的 操作 ， 存 在 着 大 量 的 扩展 集合 。 其 中 一 些 扩展 尤其 适用 于 对 路 
径 名 的 操作 。 扩 展 式 


${#parameter} 


扩展 为 parameter 内 包含 的 字符 串 的 长 度 。 一 般 来 说 ， 参 数 parameter 是 个 字符 
串 。 然 而 ， 如 果 参 数 parameter 是 “@” 或 “*”， 那 么 扩展 结果 就 是 位 置 参数 的 个 数 。 
[me@linuxbox ~]$ foo="This string is long." 


[me@linuxbox ~]$ echo "'$f00' is ${#fo0} characters long." 
‘This string is long.' is 20 characters long. 


${parameter:offset} 
${parameter:offset:length} 


这 个 扩展 用 来 提取 一 部 分 包含 在 参数 parameter 中 的 字符 串 。 扩 展 以 offset 
字符 开始 ， 直 到 字符 串 末 尾 ， 除 非 length 特别 指定 。 


[me@linuxbox ~]$ foo="This string is long.”" 
[meelinuxbox ~]$ echo $ffoo:5} 

String is long. 

[meelinuxbox ~]$ echo ${f00:5:6} 

String 


如 果 offset 的 值 为 负 ， 默 认 表 示 它 从 字符 串 末 尾 开 始 ， 而 不 是 字符 串 开 头 。 
注意 ， 负 值 前 必须 有 一 个 空格 ， 以 防 和 “$”{parameter:-word} 扩 展 混淆 。 如 果 
有 1length〈 长 度 ) 的话，length 不 能 小 于 0。 


如 果 参 数 是 “@”， 扩 展 的 结果 则 是 从 offset 开始 ，length 为 位 置 参 数 。 


[me@linuxbox ~]$ foo="This string is long." 
[me@linuxbox ~]$ echo ${foo: -5} 

long. 

[me@linuxbox -]$ echo ${foo: -5:2} 

10 
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${parameterspattern} 
${parameters%pattern} 


根据 pattem 定义 ， 这 些 扩展 去 除了 包含 在 parameter 中 的 字符 串 的 主要 部 分 。 
pattern 是 一 个 通配符 模式 ， 类 似 那 些 用 于 路 径 名 的 扩展 。 两 种 形式 的 区 别 在 于 
“#” 形 式 去 除 最 短 匹 配 ， 而 “ 失 ” 形 式 去 除 最 长 四 配 。 


[me@linuxbox ~]$ fo0=file.txt.zip 
[me@linuxbox ~]$ echo ${foo#*.} 
txt.zip 
[me@linuxbox ~]$ echo ${foo##*.} 
Zip 
${parameterspattern} 
${parameter%%pattern} 

这 些 扩 展 与 上 述 的 “#” 和 “ 失 ” 扩 展 相 同 ， 除 了 一 点 一 一 它们 从 参数 包 合 
的 字符 串 末 尾 去 除 文本 ， 而 非 字 符 串 开头 。 
[me@linuxbox ~]$ foo=file.txt.zip 
[me@linuxbox ~]$ echo ${foo%.*} 
file.txt 


[meelinuxbox -]$ echo ${foo%%.*} 
file 


${parameter/pattern/string} 

${parameter//pattern/string} 
${parameter/#pattern/string} 
${parameter/%pattern/string} 


这 个 扩展 在 parameter 的 内 容 上 执行 搜索 和 替换 非常 有 效 。 如果 文本 被 发 现 
和 通配符 pattern 一 致 ， 就 被 替换 为 string 的 内 容 。 通 常 形式 下 ， 只 有 第 一 个 出 
现 的 pattern 被 替换 。 在 “//” 形 式 下 ， 所 有 pattern 都 被 蔡 换 。“ 上 #” 形 式 要 求 匹 
配 出 现在 字符 串 开头 ,“/%?” 形 式 要求 匹 配 出 现在 字符 串 末 尾 。“/string” 可 以 省 
略 ， 不 过 和 pattern 匹配 的 文本 都 会 被 删除 。 
[me@linuxbox ~]$ foo=JPG.JPG 
[meelinuxbox ~]$ echo $ffoo/JPG/jpg} 


jpg.JPG 
[me@linuxbox ~]$ echo ${fo0//JPG/jpg} 


g.jpg 
[meelinuxbox ~]$ echo ${f00/#JPG/jpg} 
jpg .JPG 


[meelinuxbox ~]$ echo ${foo/%JPG/jpg} 
JPG. jpg 


参数 扩展 是 一 个 比较 重要 的 功能 。 进 行 字符 串 操作 的 扩展 可 以 替代 其 他 常 
用 的 命令 ， 例 如 set 和 cnut 命令 。 扩 展 通过 取代 外 部 程序 ， 改 善 了 脚本 的 执行 效 
率 。 比 如 ， 我 们 将 改动 前 面 章节 中 讨论 过 的 longest-word 程序 ， 运 用 参数 扩展 ${ 胡 } 
代替 在 subshell 中 输出 结果 的 $(echo $j | we -c)， 如 下 所 示 。 
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#!/bin/bash 


# longest-word3 : find longest string in a file 


for i; do 
if [[ -r $i ]]1; then 
max_word= 
max_len= 
for j in $(strings $i); do 
len=${#j} 
if (( len > max_len )); then 
max_len=$len 
max_word=$j 
fi 
done 
echo "$i: '$max word' {S$max_ len characters)" 
fi 
shift 
done 


接着 ,我 们 将 用 time 命令 比较 两 个 版 本 的 效率 。 


[me@linuxbox ~]$ time longest-word2 dirlist-usr-bin.txt 
dirlist-usr-bin.txt: ‘scrollkeeper-get-extended-content-list' (38 characters) 


real 0m3.618s 

user Om1.544s 

sys Om1.768s 

[me@linuxbox ~]$ time longest-word3 dirlist-usr-bin.txt 

dirlist-usr-bin.txt: ‘scrollkeeper-get-extended-content-1list' (38 characters) 


real Om0 .060s 
user Om0 .056s 
Sys 0m0 .008S 


原始 版 本 的 脚本 花费 了 3.618 秒 来 扫描 text 文件 ， 而 使 用 参数 扩展 的 新 版 本 
只 花费 了 0.06 秒 一 一 这 是 一 个 比较 大 的 改进 。 


34.2 ”算术 计算 和 扩展 
第 7 章 我 们 学 习 了 算术 扩展 ， 用 来 对 整数 进行 算术 运算 。 它 的 基本 形式 如 
下 所 示 : 


$((expression)) 


其 中 expression 是 一 个 有 效 的 算术 表达 式 。 


这 和 用 于 算法 计算 (真实 性 测试 ) 的 复合 命令 “(())” 有 关 ， 我 们 曾 在 第 27 
章 中 遇 到 过 。 


通过 前 面 章节 的 学 习 ， 我 们 已 经 了 解 了 表达 式 和 运算 符 的 常见 类 型 。 下 面 ， 
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我 们 将 更 为 完整 地 学 习 它们 。 


34.2.1 数字 进 制 
回顾 第 9 章 ， 我 们 已 经 学 习 了 八进制 (octal〉 和 十 六 进 制 《hexadecimal) 
的 数字 。 在 算术 表达 式 中 ，shell 支持 任何 进 制 表示 的 整数 。 表 34-1 列 出 了 基本 


数字 进 制 的 描述 。 
表 34-1 不 同 的 数字 进 制 
符号 描述 
Number 默认 情况 下 ，number 没有 任何 符号 ， 将 作为 十 进 制 数字 
Onumber 在 数字 表达 式 中 ， 以 0 开始 的 数字 被 认为 是 八进制 数字 
Oxnumber 十 六 进 制 符 号 
base#number base 进 制 的 number 


看 一 些 例子 ， 如 下 所 示 。 
[me@linuxbox -]$ echo $((0xff)) 


Ime@linuxbox ~]$ echo $((2#11111111) ) 
255 


这 些 例子 中 ， 我 们 输出 了 十 六 进 制 数 字 企 〈 最 大 的 两 位 数字 的 值 以 及 最 
大 的 八 位 数 〈 二 进 制 )。 


34.2.2 ”一 元 运算 符 
有 两 种 一 元 运算 符 : + 和 -。 它 们 分 别 被 用 来 指示 一 个 数字 是 正 或 是 负 。 


34.2.3 ”简单 算术 
表 34-2 列 出 了 普通 算术 运算 符 。 

表 34-2 算术 操作 符 

操作 符 描述 
+ 加 法 
一 减法 
* 乘法 
/ 整除 
素 束 求 寡 


% 取 模 (余数 》 
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这 里 大 部 分 操作 符 具 有 自 描述 性 ， 但 是 整数 除法 和 取 模 需要 更 深入 的 讨论 。 


由 于 shell 的 算术 运算 符 仅 适用 于 整数 ， 除 法 的 结果 永远 是 完整 的 数字 ， 如 
下 所 示 。 


[me@linuxbox ~]$ echo $(( 5 / 2 )) 
2 


这 使 得 除法 运算 中 余数 的 确定 尤为 重要 ， 如 下 所 示 。 


[me@linuxbox ~]$ echo $(( 5%2 )) 
1 


通过 运用 除法 和 取 模 运算 ， 可 以 确定 5 被 2 整除 的 结果 为 2， 余 数 为 1。 


计算 余数 在 循环 中 很 有 用 。 它 使 得 一 个 运算 符 能 够 在 循环 的 特定 间隔 中 执 
行 。 在 下 例 中 ， 我 们 显示 了 一 行 数字 ， 其 中 5 的 倍数 突出 显示 。 


#1/bin/bash 
# modulo : demonstrate the modulo operator 


for ((i = 0; i <= 20; i = i + 1)); do 
remainder=$( (i % 5)) 
if (( remainder == 0 )); then 
printf "<%d> " $i 
else 
printf "%d 。 $i 
fi 
done 
printf "“\n" 


运行 后 ， 结 果 如 下 。 


[me@linuxbox ~]$ modulo 
<0> 1234 <5>67 8 9 <10> 11 12 13 14 <15> 16 17 18 19 <20> 


34.2.4 赋值 


尽管 算术 表达 式 并 非 立 等 可 见 ， 但 是 它们 可 以 用 来 进行 赋值 。 通 过 前 面 不 
同 的 场景 ， 我 们 已 经 进行 了 多 次 赋值 。 每 当 赋 给 变量 一 个 值 时 ， 就 是 赋值 操作 。 
算术 表达 式 可 以 这 样 使 用 。 


[me@linuxbox ~]$ foo= 
{me@linuxbox -]$ echo $foo 


[me@linuxbox ~]$ if (( foo = 5 ));then echo “It is true."; fi 
It is true. 

[me@linuxbox ~]$ echo $foo 

5 


上 例 中 ， 先 给 变量 foo 赋 空 值 ， 并 确认 它 确 实 为 空 。 接 着 ， 执 行 一 个 以 复 
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杂 命 令 〈(foo = 5)) 为 条 件 的 过 语句 。 整 个 过 程 有 两 件 有 趣 的 事 。(1)》 它 给 变 
量 foo 赋值 5。(C(2〉 因 为 赋值 是 成 功 的 ， 所 以 条 件 为 true。 


` 记 住 上 式 中 “=” 的 确切 含义 很 重要 。 单 个 的 “=” 执 行 赋值 ， 即 foo = 5 意味 
着 “让 foo 等 于 5”。 两 个 “=” 用 来 判断 是 否 相 等 ， 即 foo 一 5 意味 着 “foo 是 否 
等 于 5? ”这 可 能 十 分 令 人 费解 ， 因 为 test 命令 认为 单个 的 “=” 判 断 字符 束 是 否 相 
等 。 但 这 也 正 是 另 一 个 使 用 新 式 的 “[[]] 和 “(( ))” 混 合 命 令 代 替 test 的 理由 。 


此 外 ， 除 了 “=” 之 外 ，shell 还 提供 了 一 些 相 当 有 用 的 赋值 语句 ， 如 表 34-3 
所 示 。 


表 34-3 ”赋值 操作 符 
运算 符 描述 
parameter = value 简单 赋值 运算 。 赋 予 parameter 值 为 value 
parameter += value 加 法 运算 。 等 价 于 parameter = parametertvalue 
Parameter -= value 减法 运算 。 等 价 于 parameter = parameter - value 
parameter *= value 乘法 运算 。 等 价 于 parameter = parameter*value 
parameter /= value ”整除 运算 。 等 价 于 parameter = parameter 二 value 
parameter %= value ” 取 模 运算 。 等 价 于 parameter = parameter % value 


parametert+ 变量 后 增 量 运算 。 等 价 于 parameter=parameter+1 《查看 后 面 的 讨论 》 
parameter-- 变量 后 减 量 运算 。 等 价 于 parameter=parameter-1 
++parameter 变量 前 增 量 运算 。 等 价 于 parameter=parameter+1 
--parameter 变量 前 减 量 运算 。 等 价 于 parameter=parameter-1 


这 些 赋值 操作 为 很 多 常见 算术 任务 提供 了 一 种 快捷 方式 。 增 量 (++〉 和 减 
量 (--) 运算 特别 有 意义 ,它们 以 1 为 间隔 增加 或 减少 参数 的 值 。 这 种 风格 的 表 
示 法 是 从 C 编程 语言 衍生 而 来 ， 并 且 已 经 被 其 他 几 种 编程 语言 采用 ， 其 中 包括 
bash 。 
[meelinuxbox ~]$ foo=1 
[meelinuxbox ~]$ echo $((foo++)) 


1 
[meelinuxbox ~-]$ echo $foo 
2 


.这 些 操作 既 可 能 在 参数 前 部 也 可 能 在 参数 尾部 出 现 。 虽 然 它们 都 以 1 为 间 
隔 增加 或 减少 参数 的 值 ， 两 者 的 位 置 安排 有 一 个 微妙 的 区 别 。 如 果 在 参数 前 部 ， 
参数 在 返回 前 增加 或 减少 )。 如 果 在 参数 尾部 ， 该 操作 在 参数 返回 后 执行 。 这 
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十 分 奇怪 ， 但 却 是 故意 为 之 。 下 面 是 一 个 示例 。 


[me@linuxbox ~]$ foo=1 
[meelinuxbox ~]$ echo $((++f00)) 
2 

[me@linuxbox ~]$ echo $foo 


如 果 给 变量 foo 赋值 1， 然 后 用 “++” 操 作 增 加 它 的 值 ,“++” 位 置 在 参数 
名 后 ， 那 么 foo 返回 值 为 1。 然而， 如 果 再 次 查看 变量 的 值 ， 会 发 现 该 值 已 经 增 
加 1。 如 果 “++” 位 置 在 参数 名 前 ， 将 得 到 比较 期 望 的 结果 ， 如 下 所 示 。 

对 于 大 部 分 shell 应 用 ， 前 置 运算 操作 则 是 最 常用 的 。 

“++” 和 “--” 操 作 符 经 常 和 循环 联合 使 用 。 下 面 我 们 将 对 modulo 脚本 做 
些 改善 ， 使 它 变 得 更 为 紧凑 。 

#!/bin/bash 
# modulo2 : demonstrate the modulo operator 
for ((i = 0; i <= 20; ++i )); do 


if (({i % 5) == 0 )); then 
printf "<%d> " $i 


else 
printf "%d " $i 
fi 
done 
printf "\n" 


34.2.5 ”位 操作 


有 一 种 操作 符 以 一 种 非 同 寻常 的 方式 巧妙 地 进行 数字 运算 ， 这 些 操作 符 在 
”位 层面 执行 运算 。 它 们 被 用 于 特定 的 低层 任务 中 ， 常 用 来 位 标志 的 设置 和 读 取 。 


表 34-4 列 出 了 位 操作 符 。 

表 34-4 位 操作 

操作 符 描述 

二 按 位 取 反 。 将 数字 里 的 每 一 位 取 反 
<< 逐 位 左 移 。 将 数字 里 的 每 一 位 向 左 移 位 
>> 逐 位 右 移 。 将 数字 里 的 每 一 位 向 右 移 位 
& 按 位 与 。 对 数字 里 的 每 一 位 执行 与 操作 


| 按 位 或 。 对 数字 里 的 每 一 位 执行 或 操作 
A 按 位 异 或 。 对 两 个 数字 的 每 一 位 执行 异 或 操作 
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注意 ， 除 了 按 位 取 反 之 外 ， 也 存在 相应 的 赋值 操作 例如 “<<=”)。 
这 里 将 示范 使 用 逐 位 左 移 操 作 ， 产 生 2 的 次 方 的 一 串 数字 。 


[me@linuxbox ~]$ for ((i=0;i<8;++i)); do echo $((1<<i)); done 
1 


34.2.6 ”逻辑 操作 


正如 在 第 7 章 中 所 述 ,“(( )” 复 合 命令 支持 多 种 比较 操作 。 有 另外 几 种 可 
以 被 用 于 判断 逻辑 是 否 成 立 的 操作 。 表 34-5 列 出 了 完整 的 清单 。 


表 34-5 Comparison Operators 


操作 符 描述 

~ 小 于 或 等 于 

> 大 于 或 等 于 

< 小 于 

> 大 于 

一 等 于 

= 不 等 于 

E24 逻辑 与 

I 逻辑 或 

sprlyeprzsexp 。 比较 《三 元 组 ) 操作 。 如果 表 达 式 exprl 非 零 (算术 为 tue)， 那 么 执行 expr2， 
否则 执行 expr3 


当 使 用 逻辑 操作 时 ， 表 达 式 遵循 算术 逻辑 的 规则 。 这 就 是 说 ， 值 为 零 的 表 
达 式 为 false， 而 非 零 表 达 式 为 tue。 如 下 所 示 ,“(( ))” 复 合 命令 将 结果 映射 到 
shell 的 正常 退出 代码 。 


[me@linuxbox -]$ if ((1)); then echo“true"; else echo "false"; fi 
true 
[me@linuxbox ~]$ if ((0)); then echo "true"; else echo "false"; fi 
false 


最 奇怪 的 逻辑 操作 是 三 元 操作 。 这 个 操作 该 操作 模仿 C 编程 语言 中 的 相 
应 操作 〉 执 行 一 个 独立 的 逻辑 测试 。 它 可 以 被 用 作 某 种 意义 上 的 ipthen/else 语 
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句 。 它 作用 于 三 个 算术 表达 式 上 《不 可 以 是 字符 串 )， 并 且 如 果 第 一 个 表达 式 为 
真 或 非 零 )， 就 执行 第 二 个 表达 式 ， 否 则 执行 第 三 个 表达 式 。 我 们 可 以 在 命令 
行 上 尝试 一 下 。 

[me@linuxbox ~]$ a&=0 

[me@linuxbox ~]$ ((a<1?++a:--a)) 

[me@linuxbox ~]$ echo $a 

Tnee1inuxbox ~]$ ((a<12++a:- -&)) 


[me@linuxbox ~]$ echo $a 
0 


这 是 一 个 实际 的 三 元 操作 ， 本 例 实现 了 一 个 来 回 切换 。 每 次 操作 被 执行 ， 
变量 a 的 值 从 0 变 为 1， 或 从 1 变 为 0。 

请 注意 在 表达 式 内 的 赋值 操作 并 不 能 简单 使 用 。 当 试图 这 样 做 时 ，bash 将 
输出 一 个 错误 。 
[me@linuxbox ~]$ a=0 
[me@linuxbox ~]$ ((a<1?a+=1:a-=1)) 


bash: ((: a<1?a+=1:a-=1: attempted assignment to non-variable (error token is 
"=1") 


这 个 问题 可 以 通过 使 用 括号 包围 赋值 表达 式 来 解决 。 
[meelinuxbox -1$ ((a<1?(a+=1): (a-=1))) 


接 下 来 ， 我 们 将 研究 一 个 更 为 综合 的 例子 ， 该 例 在 脚本 中 使 用 算术 操作 产 
生 一 个 简单 的 数字 表 。 


#!1/bin/bash 

# arith-loop: script to demonstrate arithmetic operators 
finished=0 

a=0 

printf "a\ta**2\ta**3\n" 

printf "=\t====\t====\Nn" 


until ((finished)); do 
b=$( (a**2)) 
c=$( (a*+3)) 
printf "%d\t%d\t%d\n" $a $b $c 
((a<10?++a: (finished=1))) 
done 


在 这 个 脚本 中 ， 基 于 finished 变量 的 值 实现 了 一 个 until 循环 。 最 初 ， 该 变 
量 被 设 为 0〈 算 术 假 )， 循 环 继续 ， 直 到 变量 成 为 非 零 值 。 在 循环 体内 ， 计 算计 
数 变量 a 的 平方 和 立方 。 在 循环 最 后 ， 判 断 计 数 变量 的 值 。 如 果 它 小 于 10〈 最 大 
迭代 次 数 )， 就 加 1， 否 则 给 变量 finished 赋值 1， 使 得 finished 算术 为 真 ， 从 而 
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鉴 


止 循环 。 运 行 脚本 ， 将 得 到 如 下 结果 。 


me@linuxbox ~]$ arith-loop 


[m 

a 名 中 让 a**3 
0 0 0 

1 1 1 

2 4 8 

3 9 27 
4 16 64 
5 25 125 
6 36 216 
7 49 343 
8 64 512 
9 81 729 
10 100 1000 


34.3 bc: 一 种 任意 精度 计算 语言 


我 们 已 经 了 解 了 shell 可 以 处 理 所 有 种 类 的 整数 运算 , 但 是 如 果 需 要 执行 更 
高 级 的 数学 运算 ， 或 者 甚至 使 用 浮 点 数 怎 么 办 呢 ? 答案 是 无 法 实现 ， 至 少 无 法 
用 shell 直接 实现 。 为 了 达到 这 个 目的 ， 我 们 需要 使 用 一 个 外 部 程序 。 这 里 有 几 
种 方法 可 以 使 用 ， 如 峰 入 Perl 或 AWK 是 一 个 可 能 的 解决 方案 。 但 不 幸 的 是 ， 
这 已 超出 本 书 范围 。 

另 一 种 方法 是 使 用 一 个 专门 的 计算 器 程序 ， 大 多 数 Linux 系统 都 支持 这 种 
程序 bc。 


be 程序 读 取 一 个 使 用 类 C 语言 编写 的 程序 文件 ， 并 执行 它 。bc 脚本 可 以 是 
一 个 单独 的 文件 ， 也 可 以 从 标准 输入 中 读 取 。be 语言 支持 很 多 功能 ， 包 括 变量 、 
循环 以 及 由 程序 员 自 定义 的 函数 。 在 这 里 我 们 不 会 完整 地 涵盖 be 的 知识 点 ， 而 
只 是 抛砖引玉 。be 的 man 手册 已 有 充分 详细 的 说 明 。 

以 一 个 浅显 易 懂 的 例子 开始 ， 我 们 下 面 将 写 一 个 2 加 2 的 bc 脚本 。 
/* A very simple bc Script */ 
2+2 


脚本 的 第 一 行 是 一 个 注释 。be 使 用 和 C 编程 语言 同样 的 注释 语法 。 注 释 可 
以 跨越 多 行 ， 以 /“* ”开始 ， 以 “sy/” 结 束 。 


34.3.1 bc 的 使 用 
如 果 将 上 述 bc 脚本 保存 为 foo.be， 那 么 可 以 这 样 运 行 它 
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[meelinuxbox ~]$ bc foo.bc 

bc 1.06.94 | 
Copyright 1991-1994，1997，1998，2000，2004，2006 Free Software Foundation， 
Inc 

This is free Software with ABSOLUTELY NO WARRANTY . 

For details type “warranty ' . 

4 


如 果 仔 细 看 看 ， 可 以 在 最 底部 版 权 信息 的 后 面 看 到 运行 结果 。 这 些 信 息 可 
以 通过 -q (quiet) 选 项 禁止 显示 。 
bc 也 可 以 交互 地 使 用 ， 如 下 所 示 。 


[me@linuxbox ~]$ bc -q 
2 + 2 “ 

4 

quit 


当 交 互 地 使 用 bc 时 ， 只 需 简单 地 输入 运算 值 ， 计 算 结果 就 会 立刻 被 显示 出 
来 。 使 用 bc 命令 中 的 quit 结束 交互 会 话 。 
通过 标准 输入 传递 一 个 脚本 到 bc 亦 是 可 行 的 ， 如 下 所 示 。 


[meelinuxbox ~]$ bc < foo.bc 
4 


既然 支持 标准 输入 ， 那 么 意味 着 可 以 使 用 风 入 文档 、 贱 入 字符 串 和 管道 传 
递 脚 本 。 下 面 是 一 个 嵌入 字符 串 的 例子 。 


[me@linuxbox -~]$ bc <<< "2+2"* 
4 


34.3.2 ”脚本 例子 


作为 一 个 实际 的 例子 ， 我 们 将 构建 一 个 常见 运算 的 脚本 一 一 按 月 偿还 贷款 。 

以 下 脚本 使 用 散 入 文档 传递 脚本 到 bc。 
#!1/bin/bash 
# loan-calc : script to calculate monthly loan payments 
PROGNAME=$ (basename $0) 
usage () { 

cat <<- EOF 

Usage: $PROGNAME PRINCIPAL INTEREST MONTHS 


Where: 


PRINCIPAL is the amount of the loan. 


第 34 章 字符 串 和 数字 409 


INTEREST is the APR as a number (7% = 0.07). 
MONTHS is the length of the loan's term. 


EOF 


} 
if (($# != 3)); then 
usage 
exit 1 
fi 
principal=$1 
interest=$2 
months=$3 
bc <<- EOF 
scale = 10 
i = $interest / 12 
p = $principal 


p* ((i* ((t +i)* nn))/ (1 + i)* n) - 1)) 
t a "\n" 


执行 后 ， 结 果 如 下 。 


[me@linuxbox ~]$ loan-calc 135000 0.0775 180 
1270.7222490000 


本 例 计 算 了 $135,000 贷款 的 月 付款 数 ，180 个 月 〈15 年 ) 的 年 度 百分率 为 
7.75%。 注 意 答案 的 精度 ， 它 是 由 赋 给 bc 脚本 中 scale 特定 变量 的 值 决定 的 。bc 
的 man 手册 提供 了 bc 脚本 编程 语言 的 完整 描述 。 虽 然 它 的 数学 表示 法 与 shell 
的 稍微 不 同 (bc 更 接近 于 C 语言 )， 但 是 就 本 书目 前 涵盖 的 知识 而 言 ， 大 部 分 
内 容 都 是 相似 的 。 


34.4 本 间 结 尾 语 


本 章 我 们 学 习 了 脚本 中 许多 “实用 的 ”小 技巧 。 随 着 脚本 编程 经 验 的 增长 ， 
有 效 而 巧妙 地 操纵 字符 串 和 数字 将 会 是 极其 珍贵 的 。 本 书 中 的 loan-calc 脚本 ， 
说 明了 哪怕 是 最 简单 的 脚本 也 可 以 做 一 些 真 正 有 用 的 事 。 


34.5 ”附加 项 


虽然 loan-cale 脚本 的 基本 功能 已 经 实现 ， 但 是 这 个 脚本 远 非 完 善 。 读 者 可 
以 试 着 改善 loan-calc 脚本 ， 使 其 包括 下 面 的 功能 。 
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。 对 命令 行 参数 的 充分 验证 。 


。 用 来 实现 “交互 ”模式 的 命令 行 选项 ， 该 模式 提示 用 户 输入 贷款 的 本 金 、 
利率 和 偿还 期 。 


。 更 好 的 输出 格式 。 


Os 


数 组 


在 上 一 章 中 ， 我 们 了 解 了 shell 如 何 操作 字符 串 和 数字 。 到 目前 为 止 ， 我们 
所 接触 到 的 数据 类 型 在 计算 机 科学 领域 被 称 为 标量 变量 (scalar variable)， 也 就 
是 说 ， 该 变量 包含 一 个 单一 值 。 

在 本 章 中 ， 我 们 将 会 学 习 一 种 包含 多 个 值 的 数据 结构 一 一 数组 。 事 实 上 ， 
数组 几乎 是 所 有 程序 设计 语言 的 一 大 特点 。 尽 管 shell 对 数组 的 支持 有 限 ， 但 它 
对 于 解决 程序 设计 问题 是 非常 有 帮助 的 。 


35.1 ”什么 是 数组 


数组 是 可 以 一 次 存放 多 个 值 的 变量 ， 数 组 的 组 织 形 式 如 同 表 格 一 样 。 下 面 
以 电子 表格 为 例 。 一 个 电子 表格 就 像 一 个 二 维 数组 一 样 。 它 由 行 和 列 组 成 ， 根 
据 行 与 列 的 地 址 可 以 在 电子 表格 里 标识 每 一 个 独立 单元 的 位 置 。 数 组 也 是 以 这 
种 方式 工作 的 。 数 组 中 的 单元 叫做 元 素 ， 并 且 每 个 元 素 中 含有 数据 。 使 用 一 种 
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叫做 索引 或 是 下 标的 地 址 就 可 以 访问 一 个 独立 的 数组 元 素 。 

大 多 数 的 程序 设计 语言 支持 多 维 数 组 。 电 子 表 格 就 是 多 维 数组 的 一 个 实例 ， 
该 数组 是 由 宽度 和 高 度 两 个 维度 组 成 的 二 维 数组 。 尽 管 最 经 常 使 用 的 可 能 是 二 
维和 三 维 数组 ， 但 是 很 多 语言 支持 任意 维 数 的 数组 。 

bash 中 的 数组 是 一 维 的 。 可 以 将 它 想 象 成 只 有 一 列 的 电子 表格 。 尽 管 有 这 
个 限制 ， 但 是 它们 还 是 有 很 多 的 应 用 。bash 的 第 二 个 版 本 开始 提供 对 数据 的 支 
持 。 而 最 初 的 UNIX shell 程序 sh 是 不 支持 数组 的 。 


35.2 ”创建 一 个 数组 


命名 数组 变量 同 命名 其 他 bash 变量 一 样 ， 当 访问 数组 变量 时 可 以 自动 创建 
它们 。 实 例如 下 。 


[meelinuxbox ~]$ a[1]=foo 
[me@linuxbox ~]$ echo ${a[1]} 
foo 


这 里 我 们 看 到 的 是 赋值 和 访问 数组 元 素 的 例子 。 通 过 第 一 条 命令 ， 可 将 值 
foo 赋 给 数组 a 的 元 素 1。 第 二 条 命令 显示 了 元 素 1 的 存储 值 。 在 第 二 条 命令 中 
使 用 花 括 号 是 为 了 阻止 shell 在 数组 元 素 名 里 试图 扩展 路 径 名 。 

使 用 declare 命令 也 可 以 创建 数组 ， 如 下 所 示 。 
{me@linuxbox ~]$ declare -a a 


这 是 使 用 选项 -a 和 declare 创建 数组 a 的 实例 。 


35.3 ”数组 赋值 
赋值 的 方式 可 以 有 两 种 。 使 用 下 面 的 语法 可 以 赋 单 一 值 。 


name[ subscript]=value 

这 里 的 name 是 数组 名 , 并 且 subscript 是 大 于 或 等 于 0 的 整数 (或 算术 表达 
式 )。 要 注意 的 是 ， 数 组 的 第 一 个 元 素 是 subscript0， 而 不 是 1。value 是 赋 给 数 
组 元 素 的 字符 串 或 整数 。 

使 用 下 面 的 语法 可 以 赋 多 值 。 


name={(valuel1 value2...) 
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这 里 的 name 是 数组 名 ， 并 且 将 valuel value2... 等 值 依 次 赋予 从 元 素 0 开始 
的 数组 元 素 。 例 如 ， 如 果 想 要 将 一 星期 中 天 数 的 缩写 赋 给 数组 days， 那 么 我 们 
可 以 像 下 面 这 样 赋值 。 
[meelinuxbox ~]$ days=(Sun Mon Tue Wed Thu Fri Sat) 


通过 为 每 个 值 指定 一 个 下 标 来 给 特定 元 素 赋值 也 是 可 行 的 。 


[meelinuxbox ~]$ days=([0j]=Sun [1]=Mon [2]=Tue {3]=Wed [4]=Thu [5]=Fri [6]=Sat) 


35.4 ”访问 数组 元 素 


那么 数组 有 哪些 应 用 呢 ? 就 像 使 用 电子 表格 程序 可 以 执行 很 多 数据 管理 任 
务 一 样 ， 使 用 数组 可 以 完成 很 多 程序 设计 任务 。 


以 一 个 简单 的 数据 采集 和 表示 为 例 。 创 建 一 个 脚本 ， 用 于 校 验 特定 目录 中 
文件 的 修改 次 数 。 从 这 些 数据 来 看 ， 脚 本 将 会 输出 一 个 表格 来 显示 文件 最 后 一 
次 修改 发 生 在 一 天 中 的 什么 时 候 。 使 用 这 样 的 一 个 脚本 可 以 来 检测 什么 时 候 系 
统 是 最 活跃 的 。 这 个 称 之 为 hours 的 脚本 产生 的 结果 如 下 。 


[meelinuxbox ~]$ hours . 
Hour Files Hour Files 


00 0 12 11 
01 1 13 7 
02 0 14 1 
03 0 15 7 
04 1 16 6 
05 1 17 5 
06 6 18 4 
07 3 19 4 
08 1 20 1 
09 14 21 0 
10 2 22 0 
11 5 23 0 


Total files = 80 

执行 hours 程序 , 并 指定 当前 目录 为 目标 目录 , 将 产生 一 个 表格 用 来 显示 在 
一 天 中 每 个 小 时 〈0~23) 有 多 少 文件 经 过 最 后 一 次 修改 。 产 生 表格 的 代码 如 下 。 
#1/bin/bash 
# hours : script to count files by modification time 


usage () { 
echo "usage: $(basename $0) directory" >&2 
} 
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# Check that argument is a directory 
if [[ ! -d $1 ]1; then 

usage 

exit 1 
fi 


# Initialize array 
for i in {0..23}; do hours[il=0; done 


# Collect data 

for i in $(stat -ce %y "$1"/* | cut -c 12-13); do 
j=${i/#0} 
((++hours[j])) 
({(++count)) 

done 


# Display data 
echo -e “Hour\tFiles\tHour\tFiles" 
echo -e "----\t----- \t----\t----- " 
for i in {0..11}; do 
j=$((i + 12)) 
printf "%02d\t%d\t%02d\t%d\n" $i ${hours[i]} $j ${hours[j]} 
done 
printf "\nTotal files = %d\n" $count 


这 个 脚本 包含 了 一 个 函数 〈usage) 和 由 4 部 分 组 成 的 一 个 主 函 数 。 在 第 一 
部 分 ， 我 们 检测 到 一 个 命令 行 参 数 并 且 这 是 一 个 目录 。 如 果 不 是 的 话 ， 显 示 usage 
信息 ， 同 时 退出 。 

第 二 部 分 初始 化 数组 hours。 通 过 给 每 个 元 素 赋 0 值 来 实现 。 尽 管 在 调用 数 
组 之 前 对 数组 中 的 元 素 没 有 特殊 要 求 ， 但 是 脚本 需要 保证 没有 元 素 是 空 的 。 注 
意 一 下 有 趣 的 循环 创建 方式 ， 通 过 使 用 花 括号 扩展 〈{0...23})， 能 够 很 容易 地 
为 for 循环 生成 一 系列 初始 值 。 

第 三 部 分 通过 运行 stat 程序 遍历 目录 中 每 个 文件 来 采集 数据 。 使 用 cut 选项 
从 结果 中 提取 两 位 数 的 小 时 数 (hour)。 在 循环 内 部 ， 需 要 清除 hour 域 中 的 前 导 
值 0, 这 是 因为 shell 将 要 试图 (最终 失败 了 ) 以 八进制 的 形式 来 表示 数值 00~09 
( 见 表 34-1)。 接 下 来 ， 将 与 一 天 中 的 小 时 数 相 对 应 的 数组 元 素 值 增加 1。 最 后 ， 
使 用 一 个 计数 器 (count) 来 追踪 目录 里 文件 的 总 数目 。 

脚本 的 最 后 一 部 分 显示 了 数组 的 内 容 。 首 先 我 们 输出 几 个 标题 行 ， 然 后 ， 
进入 一 个 产生 两 列 输 出 的 循环 。 最 后 ， 输 出 文件 的 最 终 统计 结果 。 


35.5 ”数组 操作 
有 很 多 常见 的 数组 操作 。 比 如 删除 数组 、 确 定数 组 大 小 和 排序 等 在 脚本 中 
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有 很 多 应 用 。 


35.5.1 输出 数组 的 所 有 内 容 
我 们 可 以 使 用 下 标 “*” 和 “@” 来 访问 数组 中 的 每 个 元 素 。 对 于 定位 参数 
来 讲 ， 符 号 “@” 较 之 更 有 用 。 例 证 如 下 。 


[me@linuxbox ~]$ animals=("a dog" "a cat" "a fish") 
[meelinuxbox ~]$ for i in ${animals[*]}; do echo $i; done 
a 

dog 

a 

cat 

a 

fish 

[me@linuxbox -]$ for i in ${animals[@]}; do echo $1i; done 
a 

dog 

a 

cat 

a 

fish 

[me@linuxbox -]$ for 1 in "S${animals[*]}"; do echo $i; done 
a dog a cat a fish 

[me@linuxbox ~]$ for i in "${animals[@]}"; do echo $i; done 
a dog 

a cat 

a fish 


我 们 创建 了 数组 animals， 并 使 用 3 个 双 单词 字符 串 为 其 赋值 ， 然 后 执行 4 
个 循环 以 便 观察 单词 拆 分 对 数组 内 容 的 影响 。 如 果 对 符号 ${animals[*]} 和 
${animals[@]} 加 以 引用 ， 就 会 得 到 不 同 的 结果 。 符 号 “*” 将 数组 所 有 内 容 放 在 
一 个 字 中 ， 而 符号 “@” 使 用 3 个 字 来 显示 数组 的 真实 内 容 。 


35.5.2 ”确定 数组 元 素 的 数目 
使 用 参数 扩展 ， 我 们 可 以 采用 类 似 获取 字符 串 长 度 的 方式 来 确定 数组 中 元 
素 的 数目 。 实 例如 下 。 


[me@linuxbox ~]$ a[100]=foo 
[Imeelinuxbox ~]$ echo ${#a[l@]} # number of array elements 
1 


[me@linuxbox ~]$ echo ${#a{100]} # length of element 100 
3 


我 们 首先 创建 了 数组 a， 并 且 将 字符 串 foo 赋 给 第 100 个 元 素 。 接 下 来 ,我 
们 使 用 符号 “@” 通 过 参数 扩展 来 确定 数组 长 度 。 最 后 ， 我 们 查看 包含 字符 串 
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foo 的 元 素 100 的 长 度 。 值 得 一 提 的 是 ， 当 将 字符 串 赋 给 元 素 100 时 ，bash 报告 
数组 中 只 有 一 个 元 素 。 这 与 其 他 一 些 编程 语言 的 行为 是 不 同 的 。 在 这 些 语言 中 ， 
数组 中 未 使 用 的 元 素 〈 元 素 0-99) 初始 化 为 空 值 并 参与 计数 。 


35.5.3 ”查找 数组 中 使 用 的 下 标 


由 于 bash 允许 在 下 标 赋 值 中 包含 “空格 ” 有 时 这 对 确定 实际 存在 的 元 素 
是 很 有 用 的 。 这 可 以 过 参数 扩展 来 实现 ， 其 形式 如 下 。 


$s{liarray[*]} 
s${iarray[@]} 


这 里 的 array 是 数组 变量 名 。 就 像 符号 “*” 和 “@” 等 参数 扩展 一 样 ， 引 
用 中 含有 的 “@” 形 式 是 最 有 用 的 ， 因 为 它 将 数组 内 容 扩展 成 独立 的 单词 。 
[me@linuxbox ~]$ foo=([2]=a [4]=b [6]=c) 
[me@linuxbox ~]$ for i in “$ffoo[e@]}"; do echo $i; done 
Rolinuxbox ~]$ for i in "${!foo[@]}"; do echo $1; done 


6 


35.5.4 ”在 数组 的 结尾 增加 元 素 


如 果 在 数组 的 结尾 需要 添加 元 素 的 话 ， 知 道 数组 中 元 素 的 数目 是 没有 用 的 ， 
因为 符号 “*” 和 “@” 返 回 的 值 并 不 会 告诉 我 们 使 用 的 最 大 数组 索引 是 什么 。 
幸运 的 是 ，shell 提供 了 一 种 解决 方法 。 通 过 使 用 “+=” 赋 值 运算 符 ， 可 以 在 数 
组 的 尾部 自动 地 添加 元 素 。 这 里 ， 我 们 将 3 个 值 赋 给 数组 fpo， 然 后 再 添加 3 个 
元 素 。 


[me@linuxbox ~]$ foo=(a b c) 
[me@linuxbox ~]$ echo ${foo[@]} 
abc 

[me@linuxbox ~]$ foo+=(d 9 f) 
[me@linuxbox -~]$ echo ${foo[@]} 
abcdef 


35.5.5 ”数组 排序 操作 


就 像 电子 表格 一 样 ， 通 常 需要 将 数据 列 中 的 值 进行 排序 。shell 虽然 没有 直 
接 的 方式 来 完成 排序 功能 ， 但 是 用 一 些 代 码 来 完成 并 非 难 事 。 
#!/bin/bash 


# array-sort : Sort an array 
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a=(fedcba) 

echo "Original array: ${al@]}" 

a sorted=($(for i in "${al@]}"; do echo $i; done | sort)) 
echo "Sorted array: ${a_sorted[@]l}" 


当 执 行 时 ， 脚 本 会 产生 如 下 的 内 容 。 


[meelinuxbox ~1$ array-Sort 
Original array: fedcba 
Sorted array : abcdef 


脚本 巧妙 地 使 用 一 个 替换 命令 将 原 数组 〈a) 的 内 容 复制 到 数组 〈(a_sorted) 中 。 
通过 改变 设计 流程 ， 我 们 可 以 这 个 基本 的 技术 就 可 被 用 来 执行 数组 中 的 多 种 操作 。 


35.5.6 ”数组 的 删除 
使 用 unset 命令 ， 我 们 可 以 删除 数组 ， 如 下 所 示 。 


[meelinuxbox -~]$ foo=(a bcdef) 
[meelinuxbox ~]$ echo ${foo[@]} 
abcdef 

[me@linuxbox -]$ unset foo 
[me@linuxbox ~]$ echo ${foo[@]} 


[meelinuxbox ~]$ 
我 们 也 可 以 使 用 unset 来 删除 单个 数组 元 素 。 


[me@linuxbox ~]$ foo=(a becde f) 
[me@linuxbox ~]$ echo ${foo[@]} 
abcdef 

[meelinuxbox -]$ unset 'foo[2]' 
[meelinuxbox -]$ echo ${foo[@]} 
abdef 


在 这 个 例子 里 ， 我 们 删除 了 数组 的 第 3 个 元 素 〈 下 标 为 2)。 记 住 ， 数 组 是 
以 下 标 0 开始 的 ， 而 不 是 1 开始 的 ! 同时 需要 注意 的 是 ， 我 们 必须 引用 数组 元 
素来 阻止 shell 执行 路 径 名 扩展 。 


很 有 趣 的 是 ， 对 数组 元 素 赋 一 个 空 值 并 不 意味 着 清空 它 的 内 容 ， 如 下 所 示 。 


[meelinuxbox ~]$ foo=(abcdeTf) 
[me@linuxbox ~]$ foo= 

[meelinuxbox ~]$ echo ${foo[@]} 
bcdef 


任何 涉及 到 不 含 下 标的 数组 变量 的 引用 指 的 是 数组 中 的 元 素 0， 如 下 所 示 。 


[me@linuxbox ~]$ foo=(a bcde f) 
[me@linuxbox ~]$ echo ${foo[@]} 
abcderf 
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[me@linuxbox ~]$ 站 
[me@linuxbox ~]$ echo ‘stfoo[@]} 
Abcdef 


35.6 本章 结尾 语 


如 果 在 bash 手册 文档 中 搜索 array， 我 们 会 发 现在 很 多 使 用 数组 变量 的 实例 。 
大 多 数 实例 是 相当 令 人 费解 的 ， 但 是 在 一 些 特殊 情况 下 可 能 会 提供 临时 效用 。 
事实 上 ， 在 shell 程序 设计 中 ， 未 能 非常 充分 地 涵盖 数组 的 所 有 内 容 ， 很 大 程度 
上 是 因为 传统 的 UNIX shell 程序 (比如 sh) 缺乏 对 数组 的 支持 。 传 统 shell 对 数 
组 普遍 缺乏 支持 是 很 不 幸 的 ， 因 为 数组 广泛 运用 于 其 他 的 程序 设计 语言 ， 并 且 
提供 强 有 力 的 工具 来 解决 多 种 程序 设计 问题 。 


数组 和 循环 本 身 具有 密切 的 关系 ， 并 且 经 常 被 一 块 使 用 。 下 面 的 循环 形式 
非常 适合 估算 数组 下 标 。 


for ((expr1; expr2; expr3)) 


# 忆 6 > 


其 他 命令 


在 本 书 最 后 一 章 ， 我 们 将 会 讲解 一 些 琐碎 零散 的 知识 。 虽 然 我 们 在 前 面 的 
章节 中 已 经 学 习 了 很 多 知识 ， 但 是 还 有 大 量 的 bash 特性 没有 涉及 到 。 对 于 那些 
整合 在 Linux 发 行 版 中 的 bash， 其 中 的 绝 大 多 数 是 相当 令 人 费解 的 ， 但 是 它们 
却 很 有 帮助 。 除 此 之 外 ， 还 有 一 些 命令 ， 虽 然 不 经 常用 ， 却 对 特定 的 程序 设计 
问题 大 有 帮助 。 下 面 我 们 将 学 习 这 方面 内 容 。 


36.1 组 命令 和 子 shell 


bash 允许 将 命令 组 合 到 一 起 使 用 ， 这 有 两 种 方式 ， 一 种 是 利用 组 命令 ， 另 
一 种 是 使 用 子 shell。 下 面 是 这 两 种 方式 的 语法 实例 。 


组 命令 : 
{ commandi1; command2:; [command3; .] } 


子 shell: 
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(command1; command2; [command3; ..]) 


这 两 种 形式 的 区 别 在 于 ， 组 命令 使 用 花 括号 将 其 命令 括 起 来 ， 而 子 shell 则 用 
圆 括号 。 值 得 注意 的 是 ， 在 bash 实现 组 命令 时 ， 必 须 使 用 一 个 空格 将 花 括号 与 
命令 分 开 ， 并 且 在 闭合 花 括号 前 使 用 分 号 或 是 换行 来 结束 最 后 的 命令 。 


36.1.1 ”执行 重 定向 


那么 组 命令 和 子 shell 有 什么 用 途 呢 ? 尽管 它们 有 一 处 主要 的 区 别 (马上 将 
会 涉及 这 一 点 ), 但 是 它们 都 可 以 用 来 管理 重 定向 。 下 面 让 我 们 看 一 个 在 多 个 命 
令 中 执行 重 定向 的 脚本 段 。 
ls -1 > output.txt 


echo “Listing of foo.txt" >> output.txt 
cat foo.txt >> output.txt 


显而易见 ，3 条 命令 将 输出 重 定向 为 output txt 文件 。 使 用 组 命令 ， 可 以 按 
照 如 下 方式 编码 。 


{ 1s -1; echo "Listing of foo.txt"; cat foo.txt; } > Output .txt 
使 用 子 shell 时 也 是 一 样 ， 如 下 所 示 。 


{ls -1; echo "Listing of foo.txt"; cat foo.txt) > output.txt 


使 用 这 个 技术 ， 可 以 减少 一 些 输入 ， 但 是 组 命令 或 是 子 shell 真正 有 价值 的 
地 方 在 于 管道 的 使 用 。 当 创建 命令 管道 时 ， 通 常 将 多 条 命令 的 结果 输出 到 一 条 
流 中 ， 这 很 有 用 。 组 命令 和 子 shell 使 得 这 一 点 变 得 简单 ， 如 下 所 示 。 


{ 1s -1; echo "Listing of foo.txt"; cat foo.txt; } | Lpr 


这 里 我 们 已 经 将 3 个 命令 的 输出 进行 合并 , 并 通过 管道 输出 到 lpr 的 输入 以 
产生 一 个 打印 报告 。 


36.1.2 ”进程 替换 


虽然 组 命令 和 子 shell 看 起 来 相似 ， 都 可 以 用 来 为 重 定向 整合 流 ， 但 是 ， 它 
们 有 一 处 主要 的 不 同 。 子 shell (正如 名 字 所 示 ) 在 当前 shell 的 子 拷贝 中 执行 命 
令 , 而 组 命令 在 当前 shell 里 执行 所 有 命令 。 这 意味 着 子 shell 复制 当前 的 环境 变 
量 以 创建 一 个 新 的 shell 实例 。 当 子 shell 退出 时 ， 复 制 的 环境 变量 也 就 消失 了 ， 因 
此 ， 任 何 对 子 shell 环境 〈 包 括 变量 赋值 ) 的 改变 也 同样 丢失 了 。 所 以 ， 大 多 数 
情况 下 ， 除 非 脚本 需要 子 shell， 和 否则 组 命令 比 子 shell 更 可 取 。 组 命令 更 快 ， 并 
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且 需 要 更 少 的 内 存 。 


在 第 28 章 中 ,我 们 已 经 接触 到 了 子 shell 环境 存在 问题 的 一 个 实例 ， 管 道中 的 
read 命令 没有 像 先前 预期 的 那样 工作 。 我 们 可 以 采用 如 下 的 方式 重新 创建 管道 。 


echo "foo" | read 
echo $REPLY 


REPLY 变量 的 内 容 总 是 为 空 ， 因 为 read 命令 是 在 子 shell 中 执行 的 ， 并 且 
当 子 shell 终止 的 时 候 ，REPLY 的 拷贝 也 遭 到 了 破坏 。 

由 于 总 是 在 子 shell 中 执行 管道 中 的 命令 ， 任 何 变量 赋值 的 命令 都 会 遇 到 这 
个 问题 。 很 幸运 的 是 ，shell 提供 了 一 种 叫做 进程 替换 的 外 部 扩展 方式 来 解决 这 
个 问题 。 

实现 进程 替换 有 两 种 方式 ， 一 种 是 产生 标准 输出 的 进程 ， 如 下 所 示 。 
<(1ist) 

另 一 种 是 吸纳 标准 输入 的 进程 ， 如 下 所 示 。 
>(1ist) 

这 里 的 list 是 一 系列 的 命令 。 

为 了 解决 上 述 read 命令 的 问题 ， 我 们 可 以 像 这 样 使 用 进程 替换 。 


read < <(echo “foo") 
echo $REPLY 


进程 替换 允许 将 子 shell 的 输出 当做 一 个 普通 的 文件 ， 目 的 是 为 了 重 定向 。 
事实 上 ， 这 是 一 种 扩展 形式 ， 我 们 可 以 查看 它 的 真实 值 。 


[me@linuxbox ~]$ echo <(echo “foo") 
/dev/fd/63 


通过 使 用 echo 来 查看 扩展 结果 ， 可 以 看 到 文件 /dewfa/63 正 为 子 shell 提 
供 输出 。 

进程 替换 通常 结合 带 有 read 的 循环 使 用 。 这 里 有 一 个 读 循环 的 实例 ， 该 读 
循环 用 来 处 理子 shell 创建 的 目录 列表 的 内 容 。 
#!/bin/bash 
# pro-sub : demo of process substitution 
while read attr links owner group size date time filename; do 

cat <<- EOF 


Filename: $filename 
Size: $size 
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Owner: $owner 
Group : $group 
Modified: $date $time 
Links: $1links 


Attributes: $attr 
EOF 
done < <(1s -1 | tail -n +2) 
循环 在 目录 列表 的 每 一 行 执行 read 操作 。 脚 本 的 最 后 一 行 产生 了 列表 本 身 。 
这 一 行将 进程 替换 的 输出 重新 定向 到 循环 的 标准 输入 。 进 程 替换 管道 中 的 tail 
命令 用 来 清除 列表 的 第 一 行 ， 之 后 这 一 行 不 再 需要 了 。 
当 执行 这 个 命令 的 时 候 ， 脚 本 产生 如 下 的 输出 。 


[meelinuxbox ~]$ pro_sub | head -n 20 


Filename : addresses .ldif 
Size: 14540 

Owner: me 

Group: me 

NModified: 2012-04-02 11:12 
Links: 


Attributes: -rw-r--r— 


Fiiename: bin 

Size: 4096 

Owner : me 

Group: me 

Modified: 2012-07-10 07:31 
Links: 


Attributes: drwxr-xr-x 


Filename: bookmarks .html 
Size: 394213 

Owner: me 

Group: me 


36.2 trap 


在 第 10 章 中 , 我 们 了 解 了 程序 如 何 响应 信号 。 同 样 我 们 也 可 以 将 这 种 功能 
应 用 到 脚本 中 。 虽 然 到 目前 为 止 ， 我们 所 写 的 脚本 还 不 需要 这 种 功能 (因为 它 
们 有 着 更 短 的 执行 时 间 ， 并 且 不 产生 临时 文件 ), 但 是 ， 拥 有 一 个 信号 处 理 程序 
可 能 对 庞大 复杂 的 脚本 大 有 神 益 。 


当 设计 一 个 庞大 复杂 的 脚本 时 ， 我 们 一 定 要 考虑 到 ， 如 果 在 脚本 正在 运行 
时 ， 用 户 注销 或 是 关闭 电脑 时 会 发 生 什 么 情况 。 当 这 样 的 情况 发 生 时 ， 将 会 把 
信和 号 发 送 到 所 有 受 影 响 的 进程 。 相 应 地 ， 执 行 那些 进程 的 程序 能 够 通过 一 些 操 
作 来 保证 程序 合理 有 序 地 结束 。 设 想 一 下 ， 比 如 说 ， 脚 本 在 执行 的 时 候 创建 了 
一 个 临时 文件 。 在 一 个 好 的 设计 中 ， 当 脚本 结束 工作 时 ， 该 临时 文件 会 自动 删 
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除 。 如 果 接 收 的 信号 表明 将 要 过 早 地 结束 程序 ， 这 个 时 候 让 脚本 删除 这 个 文件 
也 是 很 明智 的 。 


为 了 实现 这 个 目的 ，bash 提供 了 一 种 trap 机 制 。 内 置 命令 trap 可 以 恰 如 其 
分 地 实现 trap 机 制 。trap 命令 使 用 的 语法 如 下 。 


trap argument signal [signal..] 


这 里 的 argument 是 作为 命令 被 读 取 的 字符 串 ， 而 signal 是 对 信号 量 的 说 明 ， 
该 信号 量 将 会 触发 解释 命令 的 执行 。 


下 面 是 一 个 简单 的 例子 。 


#!/bin/bash 
# trap-demo : simple signal handling demo 
trap "echo 'I am ignoring you.'" SIGINT SIGTERM 


for i in {1..5}; do 
echo "Iteration $i of 5" 
Sleep 5 

done 


每 当 运行 中 的 脚本 接收 到 SIGINT 或 者 SIGTERM 信号 时 , 脚本 定义 的 trap 
将 执行 echo 命令 。 当 用 户 通过 按 下 Ctrl-C 键 来 试图 结束 脚本 时 ， 程 序 的 执行 情 
况 如 下 。 
{me@linuxbox ~]$ trap-demo 
Iteration 1 of 5 
Iteration 2 of 5 
I am ignoring you. 
Iteration 3 of 5 
I am ignoring you. 


Iteration 4 of 5 
Iteration 5 of 5 


可 以 看 出 ， 每 次 用 户 试图 中 断 程序 时 ， 都 会 输出 这 样 的 信息 。 


构造 一 个 字符 串 来 形成 一 系列 有 用 的 命令 看 起 来 是 很 笨拙 的 ， 因 此 ， 通 常 
的 做 法 是 指定 shell 函数 来 代替 命令 。 在 下 面 的 例子 中 ， 我 们 为 每 个 将 要 处 理 的 
信和 号 指定 一 个 独立 的 shell 函数 。 
#1/bin/bash 
# trap-demo2 : simple signal handling demo 
exit_on_signal_SIGINT () { 


echo "Script interrupted." 2>&1 
exit 0 
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} 

exit_on. signal_SIGTERM () { 
echo “Script terminated." 2>&1 
exit 0 


} 


trap exit_on signal SIGINT SIGINT 
trap exit._on signal SIGTERM SIGTERM 


for i in {1..5}; do 
echo "Iteration $i of 5" 
sleep 5 

done 


这 个 脚本 为 两 个 不 同 的 信号 定义 了 相应 的 trap 命令 。 当 接收 到 特定 信号 的 
时 候 ， 每 个 trap 相应 地 执行 指定 的 shell 函数 。 注 意 到 每 个 信号 处 理 函 数 中 的 exit 
命令 。 如 果 没 有 exit 命令 ， 脚 本 会 循环 执行 该 函数 。 


在 脚本 执行 的 过 程 中 ， 当 用 户 按 下 Ctrl-C 键 时 ， 产 生 的 结果 如 下 。 


[me@linuxbox ~]$ trap-demo2 
Iteration 1 of 5 

Iteration 2 of 5 

Script interrupted . 


临时 文件 

在 脚本 中 使 用 信号 控制 句柄 ， 是 为 了 删除 脚本 执行 过 程 中 用 于 保存 中 间 
变量 的 临时 文件 ， 一 些 术 语 称 其 为 临时 文件 。 传 统 意义 上 来 说 ， 类 UNIX 系 
统 中 的 程序 在 /tmp 目录 里 创建 临时 文件 ， 该 目录 是 用 于 保存 临时 文件 的 共享 
目录 。 但 是 ， 由 于 目录 是 共享 的 ， 不 可 避免 地 产生 安全 上 的 考虑 ， 尤 其 是 超 
级 用 户 特权 下 运行 的 程序 .除了 为 所 有 系统 用 户 都 可 以 访问 的 文件 设置 适当 
的 权限 之 外 ， 赋 给 临时 文件 一 个 不 可 预知 的 文件 名 是 非常 重要 的 。 这 就 避免 
了 临时 快速 攻击 (temp race attack ) 的 漏洞 。 创 建 一 个 不 可 预知 (但 是 仍然 是 
可 以 描述 的 ) 的 名 称 的 方法 如 下 所 示 。 
tempfile=/tmp/$(basename $o) .$$.$RANDOM 

这 将 会 创建 一 个 包含 程序 名 的 文件 名 ， 紧 随 其 后 的 是 进程 ID (PID ) 以 
及 一 个 随机 整数 .但 是 ， 要 注意 的 是 ，$RANDOM shell 变量 返回 一 个 范围 仅 
在 1~32767 之 间 的 值 ， 在 计算 机 领域 里 ， 这 并 不 是 一 个 很 大 的 范围 ， 因 此 ， 
单一 的 变量 实例 不 足以 抵御 一 个 不 达 目 的 不 罢休 的 攻击 者 。 

比较 好 的 一 个 方法 是 使 用 mktemp 程序 (不 要 与 mktemp 标准 库 函 数 相 混 
消 ) 来 命名 和 创建 临时 文件 。mktemp 程序 使 用 模板 作为 参数 来 创建 文件 名 。 
这 个 模板 应 该 包括 一 系列 的 义 字符 ， 可 以 用 相应 的 随机 字母 和 数字 来 代替 这 
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些 义 字符 . 义 字 符 的 序列 越 长 ， 随 机 字符 的 序列 就 会 越 长 。 下 面 是 一 个 实例 。 
tempfile=$ (mktemp /tmp/foobar.$$.XXXXXXXXXX) 

这 就 创建 了 一 个 临时 文件 ， 并 且 将 其 名 称 赋 给 了 变量 tempfile。 随机 的 字 
母 和 数字 代替 了 模板 中 的 字符 X。 那么 ， 最 终 的 文件 名 ( 在 这 个 例子 里 ， 最 
后 的 文件 名 也 包含 了 特殊 参数 $$ 的 扩展 值 以 获得 PID ) 可 能 会 如 下 所 示 。 
/tmp/foobar .6593 .U0OZuvM6654 

尽管 mktemp 手册 页 声明 ，mktemp 构造 了 一 个 临时 文件 名 ， 但 是 它 同时 
也 创建 了 这 个 文件 。 

如 果 是 普通 用 户 执行 的 脚本 ， 更 为 明智 的 做 法 是 避免 使 用 /tmp 目录 ， 而 
在 用 户主 目录 下 而 为 临时 文件 创建 一 个 目录 ， 其 代码 如 下 。 


FE[ -d S$HOME/tmp ]] || mkdir SHOME/tmp 


36.3 ”异步 执行 


有 的 时 候 我 们 希望 同时 执行 多 项 任务 。 众 所 周知 ， 所 有 现代 的 操作 系统 即便 
不 是 多 用 户 系统 ， 至 少 也 是 多 任务 系统 。 脚 本 可 以 在 多 任务 中 运行 。 

这 涉及 到 父 脚本 以 及 一 个 或 多 个 子 脚 本 的 加 载 问题 ， 子 脚本 可 以 在 父 脚 本 
运行 时 执行 其 他 额外 的 任务 。 但 是 ， 当 一 系列 脚本 以 这 种 方式 运行 的 时 候 ， 保 
持 父 脚本 与 子 脚本 的 协调 一 致 就 会 是 一 个 问题 。 也 就 是 说 ， 试 想 这 样 一 种 情况 ， 
如 果 父 脚本 与 子 脚本 彼此 相互 依赖 ， 一 个 脚本 必须 等 待 另 一 个 脚本 任务 完成 之 
后 才能 继续 完成 自己 的 任务 。 


bash 提供 了 一 个 内 置 的 命令 来 帮助 管理 异步 执行 。wait 命令 可 以 让 父 脚本 
暂停 ， 直 到 指定 的 进程 (比如 子 脚 本 ) 结束 。 


36.3.1 ”wait 命令 
首先 ， 我 们 来 演示 wait 命令 。 为 此 我 们 需要 两 个 脚本 来 完成 这 个 过 程 。 下 
面 是 一 个 父 脚 本 。 
#1/bin/bash 
# async-parent : Asynchronous execution demo (parent) 


echo "Parent: starting..." 
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echo "Parent: launching child script..." 
async-child & 

pid=$! 

echo "Parent: child (PID= $pid) launched." 


echo "Parent: continuing..." 
sleep 2 


echo "Parent: pausing to wait for child to finish..." 
wait $pid 


echo "Parent: child is finished. Continuing..." 
echo "Parent: parent is done, Exiting." 


下 面 是 一 个 子 脚本 。 


#!/bin/bash 


# async-child : Asynchronous execution demo (child) 


echo "Child: child is running..." 
sleep 5 
echo "Child: child is done. Exiting." 


在 这 个 例子 中 , 我 们 可 以 看 出 子 脚 本 内 容 非 常 简单 , 父 脚 本 执行 实际 的 操作 。 
在 父 脚本 中 , 子 脚本 加 载 并 在 后 台 运 行 。 通 过 将 $! shell 程序 参数 值 赋 给 pid 变量 
来 记录 子 脚本 的 进程 ID， 该 参数 值 总 是 包含 后 台中 最 后 一 次 运行 的 进程 ID。 


父 脚 本 继续 运行 ， 随 后 执行 带 有 子 进 程 PID 的 wait 命令 。 这 会 导致 父 脚本 
暂停 ， 直 到 子 脚 本 退出 ， 子 脚本 退出 之 后 ， 父 脚本 也 结束 。 


当 执 行 的 时 候 ， 父 脚本 和 子 脚本 产生 如 下 的 输出 。 


[me@linuxbox ~]$ async-parent 

Parent: starting... 

Parent: launching child script... 

Parent: child (PID= 6741) launched. 

Parent: continuing... 

Child: child is running... 

Parent: pausing to wait for child to finish,.. 
Child: child is done. Exiting. 

Parent: child is finished. Continuing... 
Parent: parent is done. Exiting. 


36.4 命名 管道 


大 多 数 类 UNIX 系统 支持 创建 一 个 叫做 命名 管道 的 特殊 类 型 的 文件 。 使 用 
命名 管道 可 以 建立 两 个 进程 之 间 的 通信 , 并 且 可 以 像 其 他 类 型 的 文件 一 样 使 用 。 
虽然 它们 没有 其 他 类 型 的 文件 那么 受 欢 迎 ， 但 是 它们 仍然 值得 了 解 。 
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客户 端 /服务 器 模式 是 一 种 常见 的 程序 设计 结构 。 它 可 以 使 用 命名 管道 这 样 
的 通信 方式 ， 也 可 以 使 用 网 络 连接 这 样 的 进程 间 通 信和 方式 。 

使 用 客户 端 /服务 器 程序 设计 架构 最 为 广泛 的 地 方 当然 是 Web 服务 器 与 Web 
浏览 器 之 间 的 通信 。Web 浏览 器 充当 客户 机 ， 客 户 机 对 服务 器 提出 请 求 ， 服 务 
器 通过 网 页 的 形式 对 浏览 器 做 出 回应 。 

命名 管道 的 工作 方式 与 文件 雷同 ， 但 实际 上 是 两 块 先 进 先 出 〈FIFO) 的 组 
冲 区 。 与 普通 的 〈 未 命名 的 ) 管道 一 样 ， 数 据 从 一 端 进 入 ， 从 另 一 端 出 来 。 使 
用 命名 管道 ， 也 可 以 以 如 下 方式 设置 。 
process1 > named pipe 

以 及 
process2 < named pipe 

执行 效果 等 效 于 如 下 语句 。 


process1 | process2 


36.4.1 设置 命名 管道 
首先 ,我们 必须 创建 一 个 命名 管道 。 使 用 mkfifo 命令 即 可 完成 ， 如 下 所 示 。 


Ime@linuxbox ~]$ mkfifo pipe1 
[me@linuxbox ~]$ ls -1 pipet 
prw-r--r-- 1 me me 0 2012-07-17 06:41 pipei 


这 里 使 用 mkfifo 命令 创建 一 个 名 为 pipel 的 命名 管道 。 使 用 ls 命令 查看 文 
件 属性 ， 可 以 看 到 属性 字段 的 第 一 个 字母 是 p， 这 表明 它 是 一 个 命名 管道 。 


36.4.2 ”使 用 命名 管道 
为 了 说 明 命 名 管道 是 如 何 工作 的 ， 我 们 需要 两 个 终端 窗口 (或 者 两 个 虚拟 
的 控制 台 )。 在 第 一 个 终端 中 ， 我 们 输入 一 条 简单 的 命令 ， 并 将 其 输出 重新 定位 
到 这 个 命名 管道 ， 如 下 所 示 。 


[meelinuxbox ~]$ ls -1 > pipe1 


按 下 Enter 键 之 后 ， 这 个 命令 看 起 来 像 挂 起 来 了 。 这 是 因为 从 管道 的 另 一 端 
还 没有 接收 到 数据 。 当 这 种 情况 发 生 时 ， 也 就 是 说 命名 管道 被 阻塞 。 一 - 旦 将 一 
个 进程 连接 到 管道 的 另 一 端 时 ， 情 况 就 会 有 所 改变 ， 进 程 会 从 管道 中 读 取 数据 。 
使 用 第 二 种 终端 窗口 ， 输 入 如 下 命令 。 
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[me@linuxbox ~]$ cat < pipet 


第 一 个 终端 窗口 产生 的 目录 列表 作为 cat 命令 的 输出 出 现在 第 二 个 终端 窗口 。 
一 旦 它 不 处 于 阻塞 状态 ， 第 一 个 终端 窗口 中 的 ls 命令 就 可 以 成 功 完成 。 


36.5 ”本 章 结 尾 语 


到 此 我 们 已 经 结束 了 所 有 的 学 习 内 容 。 现 在 要 做 的 唯一 一 件 事 就 是 练习 ， 
练习 ， 再 练习 。 尽 管 在 学 习 的 过 程 中 已 经 涉及 了 大 量 的 内 容 ， 但 是 ， 我 们 了 解 
的 仅仅 是 命令 行 方面 的 皮毛 而 已 。 仍 然 还 有 成 千 上 万 的 命令 行程 序 等 着 去 发 现 
和 探索 。 深 入 地 探索 /usr/bin 目录 内 容 之 后 ， 相 信 你 一 定 会 有 所 收获 ! 


网 


想必 读者 已 经 有 过 在 Linux 计算 机 的 屏幕 上 操作 


形 界面 的 经 历 ， 现 在 我 们 开始 深入 探究 Linux 命令 行 的 
强大 功能 。 


本 书 为 读者 讲解 从 在 终端 上 进行 第 一 次 击 键 输入 ， 


的 所 有 内 容 。 在 这 个 过 程 中 ， 你 将 学 到 由 数 代 命令 行 操 
乍 大 师 流传 下 来 的 这 一 永 不 过 时 的 技巧 : 文件 导航 、 环 
境 配 置 、 命 令 链 、 正 则 表达 式 的 模式 匹配 等 。 
除了 这 些 实用 的 知识 之 外 ， 作 者 还 讲解 了 这 些 工 具 
背后 的 理念 ， 以 及 桌面 Linux 系统 从 昔日 UNIX 超级 计 
算 机 中 继承 来 的 丰富 功能 。 


一 旦 略 帘 门 径 ， 你 就 会 发 现 命令 行 是 一 种 与 计算 机 


进行 通信 的 最 自然 、 最 具 表 现 力 的 方式 。 
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